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Einleitung 


Karoline Döring, Stefan Haas, Mareike König und 
Jörg Wettlaufer 


Von Lille nach Göttingen und am Ende 
hinein in den digitalen (Tagungs-)Raum 


Die Idee zur Tagung „Digital History - Konzepte, Methoden und Kritiken digita- 
ler Geschichtswissenschaften“, die von der Arbeitsgruppe Digitale Geschichts- 
wissenschaft im Verband der Historiker und Historikerinnen Deutschlands im 
März 2021 veranstaltet wurde und aus der dieser Sammelband hervorgegangen 
ist,' hat einen Vorlauf, der bis in das Jahr 2017 zurückreicht - nämlich zur da- 
maligen DH-Nord Tagung mit dem Thema „(De)constructing Digital History“. 
Diese Tagungsserie, die vom Maison européenne des sciences de Phomme et de 
la société in Lille veranstaltet wird, inspirierte Jörg Wettlaufer und Mareike Kö- 
nig dazu, eine ähnliche Veranstaltung zur Digitalen Geschichtswissenschaft in 
Deutschland durchzuführen. Die Idee war geboren, und schnell fanden sich in 
Karoline Döring und Stefan Haas Mitstreiter:innen, die halfen, die Sache ge- 
meinsam auf den Weg zu bringen. Auch die AG Digitale Geschichtswissenschaft 
war gerne bereit, die Tagung in ihr Veranstaltungsprogramm aufzunehmen. Im 
März 2020 wäre es fast soweit gewesen: Insgesamt 21 Vortragende und 122 ein- 
geschriebene Zuhörer:innen wollten sich in Göttingen im Historischen Gebäude 
der Staats- und Universitätsbibliothek drei Tage lang zu Vorträgen, Austausch 
und Diskussionen treffen. Doch es kam anders: Vier Tage vor Veranstaltungsbe- 
ginn erhielt das Organisationsteam von der Universität die Nachricht, dass auf- 
grund des damals neuartigen COVID-19-Virus die Veranstaltung nicht wie ge- 
plant stattfinden könne. Die Enttäuschung bei den Organisator:innen und allen 
Beteiligten war groß, die Einsicht in die Notwendigkeit einer Verschiebung an- 
gesichts der Pandemie aber ebenfalls. Da die epidemische Lage auch Monate 
später noch angespannt war, entschloss sich das Organisationsteam, auf ein 
Online-Format zu wechseln - ein Format, das neben einigen Einschränkungen 
zugleich viele Vorteile mit sich brachte. Für die Planung und Vorbereitung be- 
deutete der Wechsel allerdings, vieles wieder auf Anfang zu stellen und von 
Neuem zu beginnen. Der für alle Beteiligten arbeitsintensive Neubeginn hat 
sich indes gelohnt. 


1 Wir danken Andreas Fickers, dem Direktor des Luxembourg Centre for Contemporary and 
Digital History (C?DH) für die Aufnahme dieses Bandes in die von ihm mitverantwortete Reihe 
sowie dem Deutschen Historischen Institut Paris und der Fritz Thyssen Stiftung, die diese Pu- 
blikation mit finanziellen Mitteln ermöglicht haben. 


3 Open Access. © 2022 Karoline Döring, Stefan Haas, Mareike König und Jörg Wettlaufer, published by 

De Gruyter. [COE] Dieses Werk ist lizensiert unter einer Creative Commons Namensnennung 4.0 Inter- 
national Lizenz. 

https://doi.org/10.1515/9783110757101-001 
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1 Konzept des Bandes 


Mit der Änderung des Tagungsformats ging eine Neukonzeption der Veranstal- 
tung einher, die sich auch sehr positiv auf die Beiträge zu diesem Sammelband 
ausgewirkt hat. Orientierte sich die in Göttingen geplante Präsenztagung noch 
an den üblichen 20 Minuten Vortrags- und zehn Minuten Diskussionszeit, so 
lag der Fokus der Durchführung online ganz auf Diskussion und Austausch. 
Das Organisationsteam hatte dazu die Beitragenden gebeten, im Vorfeld aus- 
führliche Tagungsbeiträge allen angemeldeten Teilnehmer:innen in einem 
nicht-öffentlichen Bereich des Tagungsblogs? in einem frei wählbaren Format 
zur Verfügung zu stellen. Besonders die Respondent:innen, deren Mitwirkung 
ins Online-Format übernommen wurde, konnten sich damit intensiv auf die In- 
halte der Sektionen vorbereiten, die nun als diskussionsintensive Roundtables 
und nicht mehr als vortragslastige Panels durchgeführt wurden. Vom ausführli- 
chen schriftlichen Beitrag über Screencasts bis zu Videos auf YouTube reichte 
schließlich die Bandbreite des vorher verfügbar gemachten Materials. 

Die Beiträge wie auch der gesamte Sammelband spiegeln wider, wie sehr 
beides vom veränderten Format und Konzept der Online-Tagung profitiert hat. 
Die Beiträger:innen wurden für die geplante Präsenzveranstaltung in einem of- 
fenen Call for Papers ausgewählt und die Einreichungen gemeinsam vom Orga- 
nisationsteam und einem profilierten wissenschaftlichen Beirat? begutachtet. 
Ihre Überlegungen und Ergebnisse präsentierten die Beiträger:innen auf der 
Online-Tagung einem zahlenmäßig gegenüber der Präsenzveranstaltung stark 
angewachsenen, internationalen Fachpublikum von über 450 angemeldeten 
Teilnehmer:innen aus Deutschland, Österreich, der Schweiz und Luxemburg. 
Dieses Fachpublikum ging zudem durch das vorher zur Verfügung gestellte Ma- 
terial gut vorbereitet und konstruktiv-kritisch in die Diskussionen. Zuletzt arbei- 
tete das Organisationsteam noch einmal intensiv mit den Beitrager:innen an 
den schriftlichen Ausarbeitungen für die Publikation der Tagungsergebnisse. 
Die Rückmeldungen auf diesen verschiedenen Ebenen sind in die hier versam- 
melten Beiträge eingeflossen und haben die adressierten Fragestellungen, Me- 
thoden und Projekte weiterentwickelt. Auch zwei Jahre nach der Tagung ist mit 
dem Erscheinen des Sammelbandes somit eine aktuelle Bilanz in den oft 


2 Tagungsblog Digitale Geschichte, https://digitalhist.hypotheses.org/. 

3 Wir danken Andreas Fickers (Luxemburg), Gudrun Gersmann (Köln), Simone Lässig (Wa- 
shington), Malte Rehbein (Passau), Patrick Sahle (Wuppertal), Charlotte Schubert (Leipzig) 
und Georg Vogeler (Graz) für ihr kritisches Auge bei der Auswahl der Beitragenden und für 
ihre Beteiligung in verschiedenen Rollen an der Tagung. 
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schnelllebigen Forschungsfeldern der digitalen Geschichtswissenschaft mög- 
lich. Wovon geht diese Bilanz aus und welche Fragen adressiert sie? 


2 Digitalisierung - Digital History - Digitale Ge- 
schichtswissenschaft 


Die Meinungen über die Erfolge der Digital Humanities und speziell der digita- 
len Geschichtswissenschaft gehen auseinander.” Der vorliegende Band ist daher 
wie die Tagung mit dem englischen Begriff „Digital History“ überschrieben, der 
die größte Schnittmenge verspricht. Es handelt sich dabei um einen jungen Be- 
griff, der erst seit etwas mehr als eine Dekade im deutschen Sprachraum ver- 
wendet wird, zunächst von Peter Haber 2009,° dann auch von Wolfgang Schma- 
le 2010°. Die Übernahme in den deutschsprachigen Raum zu diesem Zeitpunkt 
und in dieser Diktion ist kein Zufall, da nach der Etablierung der Digital Huma- 
nities einige Jahre zuvor ein Vakuum zwischen der vergleichsweise bescheiden 
auftretenden Historischen Fachinformatik und den scheinbar forscher daher 
kommenden Digital Humanities entstanden war und zugleich mit „Digital 
History“ ein anglophones Vorbild bereitstand, digitale Geschichtswissenschaft 
im deutschsprachigen Raum im Sinne der Digital Humanities zu betreiben.’ 

Im Gegensatz zur „Digital History“ hat es die „Digitale Geschichtswissen- 
schaft“ noch nicht als Lemma in die deutschsprachige Wikipedia geschafft. 
Dort ist (noch) als deutsche Sprachvariante die Historische Fachinformatik ver- 
knüpft und der entsprechende Eintrag fehlt. Dafür gibt es einen Eintrag zur 
„Historischen Digital Literacy“,® worunter die Kompetenz verstanden wird, mit 
Hilfe digitaler Technologien historische Informationen zu finden und Geschich- 


4 Vgl. zum Beispiel Manfred Thaller, „Controversies around the Digital Humanities. An Agen- 
da,“ Historical Social Research 37/3 (2012): 7-29. doi: 10.12759/hsr.37.2012.3.7-23. 

5 Zunächst in Peter Haber, „Sechs Stichworte für eine Digitale Geschichtswissenschaft,“ hist. 
net. Plattform für Geschichte und digitale Medien. 24.09.2009. https://www.hist.net/archives/ 
3131. Zugriff am 18.01.2022. Dann in seiner Habilitationsschrift, die 2011 veröffentlicht worden 
ist: Peter Haber, Digital Past. Geschichtswissenschaft im digitalen Zeitalter (München: Olden- 
bourg Verlag 2011). Allerdings schrieb er schon 2006 von „Geschichtswissenschaften im digi- 
talen Zeitalter“, siehe Peter Haber, „Geschichtswissenschaften im digitalen Zeitalter. Eine Zwi- 
schenbilanz,“ Schweizerische Zeitschrift für Geschichte 56/2 (2006): 168-183. doi: 10.5169/seals- 
1679. 

6 Wolfgang Schmale, Digitale Geschichtswissenschaft (Wien: Böhlau 2010). 

7 Edward L. Ayers, „The Pasts and Futures of Digital History,“ History News 56/4 (2001): 5-9. 
8 https://de.wikipedia.org/wiki/Historische_Digital_Literacy. Zugriff am 29.11.2021. 
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te zu schreiben. Gleichzeitig entsteht mit neuen Ausdrücken wie „computerge- 
stützte Geschichte“ eine weitere Differenzierung. Der Selbstfindungsprozess ist 
folglich noch nicht abgeschlossen. 

Sichtbarer Meilenstein der deutschsprachigen Entwicklung war die Grün- 
dung der Arbeitsgruppe „Digitale Geschichtswissenschaft“ im Rahmen des Ver- 
bands deutscher Historiker und Historikerinnen im Jahre 2012.? Digitale Ge- 
schichtswissenschaft grenzte sich damit zur älteren Fachinformatik ab und öff- 
nete sich zugleich - mit einigen Einschränkungen - den Digital Humanities 
und ihren Methoden und Fragestellungen. Ein neues, weites und an den Rän- 
dern offenes Forschungs-, Praxis- und Methodenfeld bildete sich, das allein 
schon durch technische Neuerungen weiterhin im Fluss ist und sein wird. 

Die historische Forschung und Lehre haben sich in den letzten Jahren 
durch die Digitalisierung von Quellen, Methoden und Forschungsumgebungen, 
innerhalb derer Geschichtswissenschaft durchgeführt, produziert, diskutiert 
und verbreitet wird, tiefgreifend verändert. Massendigitalisierungsprojekte er- 
möglichen einen zeit- und ortsunabhängigen Zugang zu Quellen und Literatur. 
Kommerzielle und OpenSource-Programme stehen bereit, um mittels qualitati- 
ver und/oder quantitativer Datenanalyse verschiedene methodische Verfahren 
zur Analyse und Interpretation dieser Quellen anzuwenden. Die Fachinformati- 
on und -kommunikation hat sich überwiegend ins Netz verlagert und schließt 
partizipative Medien ein. Die Bandbreite an digitalen Lehrmethoden hat stark 
zugenommen, während die Online-Präsentation von Forschungsergebnissen 
und Public-Science-Projekten den Dialog und das aktive Einbinden der breiten 
Öffentlichkeit in den Forschungsprozess ermöglichen. Lehrstühle zur Digital 
History werden eingerichtet (zum Beispiel in Berlin, Bamberg und Bielefeld), 
die Historikertage haben selbstverständlich digitale Sektionen und fast jedes 
neue Forschungsprojekt hat einen (wenn auch manchmal kleinen) digitalen An- 
teil. Auch die Narrative unterliegen zunehmend weitreichenden Veränderungen 
und Modifikationen. Alles zusammengenommen hat erkennbar weitreichende 
Auswirkungen auf Konzeption, Theorie und Praxis der Geschichtswissenschaft, 


9 Für allgemeine Informationen über die Arbeitsgruppe, ihr Profil, ihre Ziele, Mitglieder und 
Arbeitsweise siehe https://www.historikerverband.de//arbeitsgruppen/ag-digitale-gw/die-ag- 
digitale-gw.html sowie das Blog der AG https://digigw.hypotheses.org/. Zugriff am 29.11.2021. 
10 Vgl. Mareike König, „Digitale Methoden in der Geschichtswissenschaft. Definitionen, An- 
wendungen, Herausforderungen,“ BIOS - Zeitschrift für Biographieforschung, Oral History und 
Lebensverlaufsanalysen 1/2 (2017): 7-21. doi: 10.3224/bois.v30i1-2.02; Guido Koller, Geschichte 
digital. Historische Welten neu vermessen (Stuttgart: Kohlhammer 2016); Manfred Thaller, From 
History to Applied Science in the Humanities (= Historical Social Research. Supplement 29 (2017) 
und Gerben Zaagsma, „On Digital History,“ BMGN - Low Countries Historical Review 128 (2013): 
3-29. 
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wobei der soziale Sammelpunkt zunehmend der letztgenannte Faktor wird: In 
der digitalen Geschichtswissenschaft kommt heute, und das zeigt auch das 
Spektrum dieses Sammelbandes, ähnlich zu den Digital Humanities eine Com- 
munity of Practice zusammen. 

Auch wenn sich die Digital History inzwischen einen zunehmend respekta- 
blen Platz im Fach erworben hat, bleibt sie in den Augen vieler Kritiker:innen 
ein „ewiges Versprechen“". In den USA ist dieser Eindruck, dass digitale Ge- 
schichtswissenschaft zu viel versprochen und zu wenig geliefert habe, 2017 im 
Whitepaper „History and Argument“? offen diskutiert worden. Für den deutsch- 
sprachigen Raum zieht dieser Sammelband nun eine Bilanz, indem er Verände- 
rungen in der Art und Weise, wie Geschichtsforschung durchgeführt und kom- 
muniziert wird, auf der einen Seite und neue Objekte, Methoden und Werkzeu- 
ge der Analyse und ihre Auswirkungen auf der anderen Seite thematisiert. Der 
Sammelband ist daher themen- und epochenübergreifend angelegt und behan- 
delt drei größere Fragenkomplexe: 

Konzepte: Zum ersten soll das Potential digitaler Methoden ausgelotet und 
kritisch beleuchtet werden. Der Fokus liegt dabei auf dem Beitrag, den digitale 
Methoden für die Entwicklung von historischen Argumenten und Interpretatio- 
nen leisten können. 

Methoden: Zum zweiten wird danach gefragt, wie sich geschichtswissen- 
schaftliche Forschung, ihre Themen, Praktiken sowie Kommunikations- und Pu- 
blikationskulturen im digitalen Zeitalter verändern und wie das Verhältnis von 
digitalen und klassisch hermeneutischen Methoden neu zu bestimmen ist. 

Kritiken: Zum dritten werden Auswirkungen des digitalen Wandels auf die 
Lehre und auf eine Geschichtswissenschaft, die sich als Public History verste- 
hen möchte, thematisiert. 

Wie schon mit der Tagung selbst strebt das Organisationsteam, das in den 
vergangenen Monaten zum Herausgeber:innenteam des Sammelbandes gewor- 
den ist, einen offenen und kritischen Dialog von digital arbeitenden und nicht- 
digital arbeitenden Wissenschaftler:innen an. Oft forschen diese zum selben 
Thema und richten den Blick aus unterschiedlichen Perspektiven auf die glei- 
chen Fragen: Können digitale Methoden bei der Beantwortung der Kernfragen 


11 Cameron Blevins, „Digital History’s Perpetual Future Tense,“ in: Debates in the Digital Hu- 
manities 2016, hg. v. Matthew K. Gold und Lauren F. Klein (Minneapolis: University of Minne- 
sota 2016), 308-324, http://dhdebates.gc.cuny.edu/debates/text/77. Zugriff am 29.11.2021. 

12 Stephen Robertson und Lincoln A. Mullen, „Digital History and Argument“, (white paper 
presented at the workshop „Arguing with Digital History“ at James Mason University. Roy Ro- 
senzweig Center for History and New Media, 13.11.2017), http://rrchnm.org/wordpress/wp-con 
tent/uploads/2017/11/digital-history-and-argument.RRCHNM.pdf. Zugriff am 29.11.2021. 
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des historischen Forschens einen Beitrag leisten oder bestätigen sie (bislang) 
nur schon Bekanntes und analog gewonnene Erkenntnis, wenn auch auf einer 
anderen empirischen Basis? Ist digitale Geschichtswissenschaft die Antwort auf 
die Frage nach der Beziehung traditioneller Geschichtswissenschaft (und ihrer 
Methoden) zu den Digital Humanities? Gibt es einen qualitativen Unterschied 
zwischen analogen und digitalen Methoden in Bezug auf Interpretation und 
Einordnung von Ergebnissen oder lösen sich diese schließlich doch im Diskurs 
oder gar in den Praktiken auf? Die Beiträge des Sammelbandes zeigen Konzepte 
zum Umgang mit Digitalität und der digitalen Transformation, bestimmen den 
Ort digitaler Methoden innerhalb der Geschichtswissenschaften neu und erkun- 
den kritisch aktuelle wie zukünftige Arbeitsfelder digitaler Geschichte.” Bei al- 
ler fachlich notwendigen Differenz ist ihnen gemeinsam, dass sie die Auswir- 
kungen dieses zum Teil gar nicht mehr so neuen Zusammentreffens von Ge- 
schichtswissenschaft und Informatik auf die gegenwärtige Arbeit von 
Historiker:innen zu erfassen, zu bewerten und kritisch zu begleiten suchen. Die 
Diskussion, die darüber im Tagungsraum online begonnen wurde, soll mit den 
publizierten Beiträgen weitergeführt werden. Wir wünschen eine anregende 
Lektüre! 
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Digitalisierung der Geschichtswissenschaften 


Torsten Hiltmann 
Vom Medienwandel zum Methodenwandel 


Die fortschreitende Digitalisierung und ihre Konsequenzen für 
die Geschichtswissenschaften in historischer Perspektive 


Abstract: This article assesses the current process of digitalisation by comparing 
it with previous media changes in order to better understand its practical impli- 
cations for historical scholarship. In doing so, it shows that we are not just deal- 
ing with another turn, but with a fundamental change in the very nature of 
communication itself. By distinguishing between data and their representation 
and, building on this, between medial and conceptual digitality, the article 
demonstrates that digitalisation proceeds in different phases and discusses the 
resulting consequences for historical scholarship, which are reflected in the 
need for a strong data culture, the critical appropriation of new methods, and 
the further refinement of our theories. 


Keywords: digital history, media change, methodological change, epistemolo- 
gy, digitization, data culture, theory 


Zusammenfassung: Ziel des Beitrags ist es, den aktuellen Prozess der Digitali- 
sierung durch den Vergleich mit früheren medialen Entwicklungen und Umbrü- 
chen in seiner Tragweite und Ausprägung einzuordnen und daraus Schlussfol- 
gerungen für die Geschichtswissenschaften zu ziehen. Der Beitrag zeichnet 
nach, dass wir es dabei nicht nur mit einem weiteren Turn zu tun haben, son- 
dern mit einer grundlegenden Veränderung unserer Kommunikation insgesamt. 
Durch die Unterscheidung zwischen den Daten und ihrer Repräsentation und 
darauf aufbauend zwischen medialer und konzeptioneller Digitalität, macht der 
Beitrag deutlich, dass sich auch die Digitalisierung in unterschiedlichen Adapti- 
onsstufen vollzieht. Er diskutiert die sich daraus ergebenden Konsequenzen für 
die Geschichtswissenschaften und fasst diese in der Notwendigkeit einer star- 
ken Datenkultur, der kritischen Aneignung neuer Methoden und der Weiterent- 
wicklung unserer Theorien zusammen. 


Schlagwörter: Digital History, Medienwandel, Methodenwandel, Epistemologie, 
Digitalisierung, Datenkultur, Theorie 


8 Open Access. © 2022 Torsten Hiltmann, published by De Gruyter. [EVER Dieses Werk ist lizensiert 
unter einer Creative Commons Namensnennung 4.0 International Lizenz. 
https://doi.org/10.1515/9783110757101-002 
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Die Geschichtswissenschaften sind einem konstanten Wandel unterworfen. 
Dies gilt auch fiir den Grad ihrer Digitalisierung und die Art und Weise, mit der 
sie digitale Medien und Methoden in ihre Arbeitsweisen und ihre Fachkultur in- 
tegrieren. In einer kurzfristigeren Perspektive von nur einigen Jahren mögen 
diese Entwicklungen kaum sichtbar sein. Weitet man den Blick jedoch auf die 
letzten 20 bis 30 Jahre, so erscheint der bereits zurückgelegte Weg erheblich 
und nicht von der Hand zu weisen. Während frühe Projekte schon in den 1970er 
Jahren für ihre Forschungen auf Großrechenanlagen zurückgriffen, hat sich der 
Computer dann in den 1980er und vor allem in den 1990er Jahren auch in der 
Breite durchgesetzt und ist zu einem alltäglichen Arbeitsinstrument geworden.! 
Seitdem müssen Texte nicht erst genauer vorgeplant werden, bevor man sie an 
der Schreibmaschine tippt, sondern werden direkt am Computer entworfen.? 
Der direkte Austausch zwischen den Forschenden erfolgt nicht mehr per Brief, 
sondern mindestens per Email, und statt die zentralen Nachschlagewerke, En- 
zyklopädien, Inventare und Kataloge als gedruckte Werke in der Bibliothek zu 
konsultieren, geschieht dies mittlerweile in den meisten Fällen über entspre- 
chende digitale Angebote im World Wide Web. Ähnliches gilt für die Fachkom- 
munikation und das Rezensionswesen. Dabei wurde Diensten wie H-Soz-Kult 
und Clio-online, die unsere Fachkultur heute erheblich mitprägen, anfänglich 
mit viel Skepsis begegnet.’ Zu erwähnen ist schließlich ebenso die zunehmende 
Rolle von Open-Access-Publikationen‘* und die Umstellung des Erwerbs fachhis- 


1 Zu den verschiedenen Stufen der frühen Aneignung computerbasierter Technologien durch 
die Geschichtswissenschaften vgl. Manfred Thaller, „Entzauberungen: Die Entwicklung einer 
fachspezifischen historischen Datenverarbeitung in der Bundesrepublik [1990],“ Historical So- 
cial Research/Historische Sozialforschung. Supplement 29 (2017): 178-192. 

2 Zur empfundenen Erleichterung der ersten Nutzer:innen siehe Bernd Gregor, „Computerge- 
stützter Satz: Protokoll der Entstehung dieses Buches,“ in Computerfibel für die Geisteswissen- 
schaften: Einsatzmöglichkeiten des Personal Computers und Beispiele aus der Praxis, hg. v. Man- 
fred Krifka (München: C.H. Beck, 1986), 265-282. 

3 Vgl. Thomas Meyer, „H-Soz-Kult und Clio-online: Von der Mailingliste zur Online-Commu- 
nity,“ Bibliotheksdienst 52/3-4 (2018): 185-195, hier: 186, doi: 10.1515/bd-2018-0026; Rüdiger 
Hohls, „Historische Fachkommunikation im Umbruch: Ein Rückblick auf die Anfänge des H- 
Net und von H-Soz-u-Kult,“ in 20 Jahre Arbeitsgemeinschaft Geschichte und EDV, hg. v. Jörn 
Kobes, Kai Ruffing und Wolfgang Spickermann (Gutenberg: Computus Druck Satz & Verlag, 
2013), 147-166, hier: 156-157. 

4 Diese Entwicklung wird nicht zuletzt durch die Politik der Drittmittelgeber befördert. Die 
Deutsche Forschungsgemeinschaft informiert über ihre diesbezügliche Position auf einer neu 
eingerichteten Website, siehe „Open Access“, Deutsche Forschungsgemeinschaft, https:// 
www.dfg.de/foerderung/programme/infrastruktur/lis/open_access/index.html. Zugriff am 
14.12.2021. 
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torischer Zeitschriften durch die Universitätsbibliotheken und Institute von 
Print-Ausgaben auf Online-Publikationen. 

Die angefiihrten Entwicklungen haben das historische Arbeiten und die his- 
torische Wissensproduktion in ihren Bedingungen bereits grundlegend verän- 
dert, ohne dass dies in der Breite des Faches wirklich tiefgreifend reflektiert 
wurde.” Doch scheint die Entwicklung in den letzten zwei bis drei Jahren noch 
einmal deutlich an Dynamik gewonnen zu haben, was den Eindruck eines allge- 
meinen Umbruchs weiter stärkt. Dieser Eindruck resultiert nicht zuletzt aus der 
Einrichtung gleich mehrerer Professuren mit einem Schwerpunkt in den digita- 
len Geschichtswissenschaften (Berlin, Bielefeld, Bamberg, Gießen, Trier)‘, de- 
nen sicherlich noch weitere folgen dürften. Im Rahmen des Aufbaus einer Na- 
tionalen Forschungsdateninfrastruktur wurde auf Initiative des Verbands der 
Historikerinnen und Historiker Deutschlands eine eigene Konsortialinitiative 
für die historisch arbeitenden Geisteswissenschaften aufgebaut, an der mehr 
als 80 Institutionen beteiligt sind, um den Weg der Geschichtswissenschaften 
hin zu einer stärker datengetriebenen Forschung in einem digitalen For- 
schungsumfeld zu begleiten und voranzubringen.’ Im Oktober 2021 erschienen 
darüber hinaus die ersten Beiträge der neuen und auch in ihren Präsentations- 
möglichkeiten hochinnovativen Zeitschrift „Journal of Digital History“, die mit 
ihrer Einbindung von Daten und Methoden auf unterschiedlichen auswählba- 
ren und ausführbaren Text- und Codelayern für die gesamten Digital Huma- 
nities wie für die zukünftigen Geschichtswissenschaften wegweisend ist.* Und 
nicht zuletzt sei hier auch das erhebliche Tagungsaufkommen in den letzten 
beiden Jahren genannt, das nicht allein mit der Erfahrung der Pandemie zu be- 


5 In den Digitalen Geschichtswissenschaften hat sich die Auseinandersetzung lange vor allem 
auf die Möglichkeiten des Internet bzw. des World Wide Web und der Hypertextualität konzen- 
triert, vgl. Peter Haber, Digital Past: Geschichtswissenschaft im digitalen Zeitalter (München: 
Oldenbourg Verlag, 2011), doi: 10.1515/9783486712339; Wolfgang Schmale, Digitale Geschichts- 
wissenschaft (Wien: Böhlau, 2010); sowie zuletzt Christian Wachter, Geschichte digital schrei- 
ben: Hypertext als non-lineare Wissensrepräsentation in der Digital History (Bielefeld: transcript, 
2021), doi: 10.1515/9783839458013. Allgemeinere Perspektiven öffnete zuletzt Adam Crymble, 
Technology and the Historian: Transformations in the Digital Age (Urbana: University of Illinois 
Press, 2021). Vgl. zudem den Beitrag von Andreas Fickers in diesem Band. 

6 Die meisten dieser neu geschaffenen Professuren sind in einer Liste von Patrick Sahle zu den 
im Bereich der Digital Humanities ausgeschriebenen Professuren einsehbar: „Professuren für 
Digital Humanities,“ DHdBlog (06.02.2019), https://dhd-blog.org/?p=11018. Zugriff am 
15.12.2021. 

7 „NFDI4Memory“, NFDI4Memory, https://4memory.de/. Zugriff am 15.12.2021. 

8 „Journal of Digital History“, University of Luxembourg, C2DH, https://journalofdigitalhisto 
ry.org/en. Zugriff am 15.12.2021. 
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gründen ist. Neben der schon für 2020 geplanten „Digital-History“-Tagung?, für 
die dieser Beitrag entstand, und der ebenfalls ursprünglich für 2020 geplanten 
„Data for History“-Konferenz’® fanden im deutschsprachigen Raum allein im 
Jahr 2021 mindestens zwölf weitere geschichtswissenschaftliche Tagungen und 
Workshops mit einem digitalen Schwerpunkt statt.” 

Man könnte auch sagen, dass wir uns gerade in einer sehr dynamischen 
Phase in der Entwicklung der digitalen Geschichtswissenschaften und der (wei- 
teren) Digitalisierung unseres Faches als solches befinden. Eine ähnliche Wahr- 
nehmung von digitalem Aufbruch gab es in den Geschichtswissenschaften zwar 
immer wieder; dies tut der derzeitigen Entwicklung aber keinen Abbruch. Viel- 
mehr stellt sich die Frage, wie man diese aktuelle Entwicklung genauer einord- 
nen und auf dieser Grundlage proaktiv mitgestalten kann. Genau darum soll es 
in diesem Beitrag gehen. 

Dafür soll im Folgenden die Perspektive weiter geöffnet und der zugrunde- 
liegende Prozess der Digitalisierung als solcher historisiert werden. Aus der Per- 
spektive eines Mediävisten sollen hierfür zum Vergleich zwei grundlegende me- 
diale Umbrüche herangezogen werden, die die mittelalterliche Kultur und Ge- 
sellschaft und damit auch die unsere nachhaltig beeinflussten und mit denen 
die Digitalisierung immer wieder verglichen wird: der Übergang von der Münd- 
lichkeit zur Schriftlichkeit sowie die Entstehung des Buchdrucks. Ziel ist es, auf 
der Basis dieses Vergleichs die Grundlagen der Digitalisierung und die damit 
verbundenen Konsequenzen zu identifizieren und am Beispiel der Geschichts- 
wissenschaften die sich daraus ergebenden Entwicklungslinien nachzuvollzie- 
hen, um schließlich zu prüfen, welche Schlussfolgerungen sich konkret für die 
digitalen Geschichtswissenschaften selbst ableiten lassen. Der Beitrag soll da- 
mit zeigen, dass wir es bei der Digitalisierung nicht einfach nur mit einem wei- 


9 „Digital History: Konzepte, Methoden und Kritiken digitaler Geschichtswissenschaften“, 
https://digitalhist.hypotheses.org/. Zugriff am 15.12.2021. 

10 „Data for History: Modeling Time, Places, Agents“, Data for History Consortium, https:// 
d4h2020.sciencesconf.org/. Zugriff am 15.12.2021. 

11 Dabei ging es bei den meisten dieser Veranstaltungen um ganz spezifische Anwendungsfelder 
wie Gender History (https://www.gw.uni-jena.de/digitalgenderhistory), Rechtsgeschichte 
(https://www.lhlt.mpg.de/2255460/event-21-03-04-digital-methods-and-resources-in-legal- 
history), Baltische Geschichtsforschung (https://www.balt-hiko.de/baltische-historikertreffen/), 
Historische Bildungsforschung (https://www.uni-muenster.de/EW/ife/arbeitsbereiche/hist_ 
bildf/digi-hbf.html), historische Kartographie (https://kbl.badw.de/fileadmin/user_upload/ 
Files/KBL/Aktuelles/KBL_Flyer_WEB.pdf), zeithistorische Portale (https://www.zlb.uni-jena. 
de/veranstaltungen/zeithistorische+portale+und+digitale+sammlungen) oder auch frühneu- 
zeitliche Universitäts- und Gelehrtengeschichte (https://pcp-on-web.htwk-leipzig.de/project/ 
pcp-reloaded/de/). Zugriff jeweils am 15.12.2021. 
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teren Turn zu tun haben, sondern mit einer ganz grundlegenden Veränderung 
unserer gesamten Kommunikations- und Arbeitsweisen als Historiker:innen, 
aber auch als Gesellschaft insgesamt, die weitreichende Konsequenzen hat. Un- 
ter näherer Betrachtung lassen sich in diesem Prozess, was die Reichweite und 
Nutzung der damit einhergehenden Veränderungen und Potentiale angeht, 
zwei verschiedene mögliche Adaptionsstufen unterscheiden, von denen wir, 
wie im Folgenden gezeigt werden soll, die zweite erst allmählich zu beschreiten 
beginnen. 


1 Struktureller Vergleich von Verschriftlichung, 
Erfindung des Buchdrucks und Digitalisierung 


Es fehlt natürlich nicht an Beiträgen, die die Digitalisierung in die Medien- und 
Kommunikationsgeschichte” und übergreifender in die Geschichte von Wahr- 
nehmung und Denken einordnen.” Dabei wird sie immer wieder, ganz zu 
Recht, nach Sprache, Schrift und Buchdruck als vierte „kognitive Revolution“ 
bezeichnet, als technische Innovation, die nicht nur quantitative Auswirkungen 
hatte, sondern die Art des Denkens selbst veränderte.'* Gerade um das Jahr 
2000 wurde hierzu häufig der Vergleich mit der Einführung des Buchdrucks 
herangezogen.” Der Bezug zum Buchdruck scheint dabei ein Allgemeinplatz ge- 


12 Für einen Überblick der Literatur vgl. zum Beispiel Ramön Reichert, „Theorien digitaler 
Medien,“ in Digital Humanities: Eine Einführung, hg. v. Fotis Jannidis, Hubertus Kohle und 
Malte Rehbein (Stuttgart: J.B. Metzler, 2017), 19-34, doi: 10.1007/978-3-476-05446-3_3. Als 
Klassiker auf diesem Feld der Mediengeschichte ist hier zu nennen: Marshall McLuhan, The 
Gutenberg Galaxy: The Making of Typographic Man (Toronto: University of Toronto Press, 1962), 
der das Ende der Gutenberg-Galaxis zwar in den elektronischen Medien wie dem Fernsehen 
sah, in seiner grundsätzlichen Einordnung des medialen Wandels und der Buchkultur (und 
ihrer Ablösung) jedoch immer wieder als grundlegende Referenz dient. 

13 In den letzten Jahren stark diskutiert: Armin Nassehi, Muster: Theorien der digitalen Gesell- 
schaft (München: C.H. Beck, 2019). Siehe ferner Florian Süssenguth (Hg.), Die Gesellschaft der 
Daten: Über die digitale Transformation der sozialen Ordnung (Bielefeld: transcript, 2015); Mi- 
chael Giesecke, Von den Mythen der Buchkultur zu den Visionen der Informationsgesellschaft 
(Frankfurt am Main: Suhrkamp, 2002). 

14 Stevan Harnad, „Post-Gutenberg Galaxy: The Fourth Revolution in the Means of Production 
of Knowledge,“ Public-Access Computer Systems Review 2/1 (1991): 39-53; Luciana Floridi, The 
4th Revolution. How the Infosphere is Reshaping Human Reality (Oxford: Oxford University 
Press, 2014). 

15 Wolfgang Frühwald, „Das Ende der Gutenberg-Galaxis: Über den Einfluß des Mediums auf 
den Inhalt wissenschaftlicher Publikationen,“ Leviathan 26/3 (1998): 305-318; Jürgen Fröhlich, 
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worden zu sein, so dass 2015 in der Zusammenfassung des von Wolfgang 
Schmale herausgegebenen Bandes ,,Digital Humanities“ von dem ,,in diesem 
Kontext sonst obligatorischen Satz, die Digitalisierung sei in ihrer Bedeutung 
nur mit der Erfindung des Buchdrucks vergleichbar,“ gesprochen wird. 


2 Erfindung des Buchdrucks mit beweglichen 
Lettern 


Tatsächlich ist dieser Vergleich naheliegend. Durch den Buchdruck” konnten 
Texte mechanisch in deutlich größerer Zahl und damit wesentlich günstiger 
produziert werden als durch ihre handschriftliche Vervielfältigung. Zugleich 
war damit eine erhebliche Qualitätssteigerung verbunden, da der Text nun weit- 
gehend identisch reproduziert werden konnte.'® Dies führte dazu, dass Wissen 
und Informationen deutlich schneller und weiter kommuniziert und geteilt wer- 
den konnten und damit letztlich eine neue „Sphäre öffentlicher Kommunikation 
(ob als Literatur, Poesie, Aufklärungsschriften oder Manifeste)“ entstand.'? Spe- 
zifische Texte und Informationen konnten nun erheblich größere Gruppen errei- 
chen, was im 16. Jahrhundert zu einschneidenden politischen (Bauernkriege) 
und religiösen Auswirkungen (Reformation) führte.” Aber auch neue Formen 
von religiöser und herrschaftlicher Propaganda wurden auf diese Weise er- 


„Was aber soelchs himmelkorn bedüt / ist Gott allein zewiissen‘: Phänomene struktureller 
Amnesie in medialen Umbruchzeiten (Flugblatt und Internet),“ in Mediaevistik und neue Me- 
dien, hg. v. Klaus van Eickels, Ruth Wesselbaumer und Ingrid Bennewitz (Ostfildern: Thorbe- 
cke, 2004), 49-66. Für eine breitere Einordnung siehe vor allem Horst Wenzel, Mediengeschich- 
te vor und nach Gutenberg (Darmstadt: Wissenschaftliche Buchgesellschaft, 2007). 

16 Stefan Zahlmann, „Die Digital Humanities und der Mensch: Ein Kommentar,“ in Digital 
Humanities: Praktiken der Digitalisierung, der Dissemination und der Selbstreflexivität, hg. v. 
Wolfgang Schmale, Historische Mitteilungen - Beihefte, Bd. 91 (Stuttgart: Steiner, 2015), 
175-180, hier: 175. 

17 Bei der weiteren Verwendung des Begriffs „Buchdruck“ ist stets der Buchdruck mit beweg- 
lichen Lettern gemeint. 

18 Die voluminöse Studie von Michael Giesecke, Der Buchdruck in der frühen Neuzeit: Eine 
historische Fallstudie über die Durchsetzung neuer Informations- und Kommunikationstechnolo- 
gien (Frankfurt am Main: Suhrkamp, 1991) gilt weiterhin als Standardwerk zur Geschichte des 
Buchdrucks. 

19 Manfred Faßler und Wulf Halbach, Geschichte der Medien (München: Fink, 1998), 10. 

20 Elizabeth L. Eisenstein, The Printing Press as an Agent of Change: Communications and Cul- 
tural Transformations in Early Modern Europe. Volumes I and II (Cambridge [England], New 
York: Cambridge University Press, 1979). 
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probt.?! Um diese neue Technologie herum entstanden mit den Druckereien und 
vor allem mit dem Verlagswesen ganz neue Strukturen, die die Verbreitung von 
Texten, Informationen und Wissen über die nächsten Jahrhunderte grundle- 
gend prägten.” 

Die Analogien zu den Entwicklungen seit den 1990er Jahren liegen auf der 
Hand. Mit der Etablierung des Internets hat die Möglichkeit zur Veröffentli- 
chung und Verbreitung von Texten, wie allgemein von Informationen und Wis- 
sen, einen vergleichbaren Entwicklungssprung erlebt, nicht zuletzt durch For- 
mate wie Blogs und die später aufgekommenen sozialen Medien.” Texte und 
andere Medien können nun innerhalb einer gegebenen Infrastruktur kostenlos 
oder mit geringen Kosten ein potentiell unbegrenztes Publikum erreichen, was 
zu einer grundlegenden Veränderung der Kommunikations- und Publikations- 
strukturen und der mit diesen verbundenen Institutionen wie Verlage, Fernseh- 
anstalten und so weiter führte.” Wie durch die Erfindung und Verbreitung des 
Buchdrucks in der Frühneuzeit haben die neuen Medien auf Grundlage des In- 
ternets zu tiefgreifenden politischen und gesellschaftlichen Umbrüchen geführt 
(oder sind noch dabei). 

Dennoch beschreiben diese Beschleunigung der Kommunikation, die Ver- 
mischung von Produzent:innen und Konsument:innen sowie die Vergrößerung 
der Gruppe der potentiellen Kommunikationsteilnehmer:innen, die mit dem In- 
ternet und den sozialen Medien assoziiert werden, nur einen Effekt der Digitali- 
sierung, jedoch nicht die Digitalisierung selbst. Deren eigentlicher Kern und de- 
ren eigentliche Tragweite liegen woanders - ähnlich wie dies beim Buchdruck 
und bei der Verschriftlichung der Fall ist. Denn die Art und Weise, wie Informa- 


21 Vgl. u.a. Robert W. Scribner, „Flugblatt und Analphabetentum: Wie kam der gemeine 
Mann zu reformatorischen Ideen?“ in Flugschriften als Massenmedium der Reformationszeit, 
hg. v. Hans-Joachim Köhler (Stuttgart: Klett-Cotta, 1981), 65-76; Jan-Dirk Müller, „Publizistik 
unter Maximilian I.: Zwischen Buchdruck und mündlicher Verkündigung,“ in Sprachen des 
Politischen: Medien und Medialitdt in der Geschichte, hg. v. Ute Frevert und Wolfgang Braungart 
(Göttingen: Vandenhoeck und Ruprecht, 2004), 95-122. 

22 Andreas Würgler, Medien in der Frühen Neuzeit (München: De Gruyter Oldenbourg, 2009); 
Hans Erich Bödeker, „Aufklärung als Kommunikationsprozeß,“ Aufklärung 2/2 (1987): 89-111. 
23 Vgl. Newton Key, „Crowdsourcing the Early Modern Blogosphere,“ in Historyblogosphere: 
Bloggen in den Geschichtswissenschaften, hg. v. Peter Haber und Eva Pfanzelter (München: 
Oldenbourg Wissenschaftsverlag, 2013), 101-118, doi: 10.1524/9783486755732.101 sowie zu 
den sozialen Medien allgemein: Jan-Hinrik Schmidt und Monika Taddicken (Hg.), Handbuch 
Soziale Medien (Wiesbaden: Springer, 2017). 

24 Siehe etwa für den Bereich der Politik und der politischen Institutionen Martin Emmer, 
„Soziale Medien in der politischen Kommunikation,“ in Handbuch Soziale Medien, hg. v. 
Jan-Hinrik Schmidt und Monika Taddicken (Wiesbaden: Springer, 2017), 81-99. 

25 Vgl. Felix Stalder, Kultur der Digitalität (Berlin: Suhrkamp, 2016), 203-278. 
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tionen gespeichert und vermittelt werden, bleiben jeweils gleich. Beim Buch- 
druck geschieht dies, wie schon zuvor in den Handschriften, über die Schrift. 
Im Internet wiederum, wie schon zuvor in der Elektronischen Datenverarbei- 
tung und beim Home-PC, über die Repräsentation von Informationen in Form 
von Daten. Kurz, das Internet und die Vernetzung unserer Gesellschaft sind 
nicht die Digitalisierung, sondern bauen auf dieser auf, ganz so, wie auch der 
Buchdruck auf dem Prozess der Verschriftlichung aufbaut. Die Wurzeln des ei- 
gentlichen Medienwandels liegen also tiefer. 


3 Verschriftlichung 


Möchte man den tiefgreifenden Wandel, der mit der Digitalisierung verbunden 
ist, wirklich fassen, muss man meines Erachtens noch ein Stück weiter bis zum 
Prozess der Verschriftlichung selbst zurückgehen, wie er sich im Mittelalter be- 
sonders im 12. und 13. Jahrhundert vollzogen hat.” Zwar hatte der Buchdruck 
mit der mechanischen Vervielfältigung von Texten in Hinblick auf deren Ver- 
breitung und Nutzung weitreichende Folgen, die Grundlagen der Kommunika- 
tion blieben jedoch die gleichen wie zuvor bei der Handschriftenproduktion: 
Die Texte wurden schriftlich vermittelt. Der mediale Bruch von der Oralität zur 
Schriftlichkeit hingegen betraf die Art und Weise selbst, wie Texte, Aussagen 
und Informationen repräsentiert, gespeichert und vermittelt werden. Hier än- 
derte sich der grundlegende Modus der Kommunikation und führte zu deutlich 
weitreichenderen gesellschaftlichen und kulturellen Veränderungen. 

So ist die mündliche Kommunikation dadurch geprägt, dass der Akt der 
Kommunikation an eine bestimmte Situation, das heißt an einen bestimmten 
Ort, eine bestimmte Zeit und bestimmte Teilnehmer:innen gebunden ist. Mit an- 
deren Worten, Sprechende und Hörende müssen an der Interaktion direkt und 
zur gleichen Zeit teilnehmen. Die mündlich übertragenen Inhalte werden dabei 
allein als Sprache im Gedächtnis der Teilnehmenden gespeichert und sind an 


26 Zum Verschriftlichungsprozess im Mittelalter siehe die Arbeiten der beiden Sonderfor- 
schungsbereiche SFB 231 „Träger, Felder, Formen pragmatischer Schriftlichkeit im Mittelalter“ 
in Münster und SFB 321 „Übergänge und Spannungsfelder zwischen Mündlichkeit und Schrift- 
lichkeit“ in Freiburg, sowie einführend Hagen Keller, „Vom ‚heiligen Buch‘ zur ‚Buchführung‘: 
Lebensfunktionen der Schrift im Mittelalter,“ Frühmittelalterliche Studien 26 (1992): 1-31; Mi- 
chael T. Clanchy, From Memory to Written Record: England 1066-1307, 3. Aufl. (Malden: Wiley- 
Blackwell, 2013). Prozesse der Verschriftlichung gab es natürlich auch schon in den frühen 
Hochkulturen, im antiken Griechenland und in anderen Weltregionen, vgl. für einen Überblick 
Peter Stein, Schriftkultur: Eine Geschichte des Schreibens und Lesens (Darmstadt: Primus, 2006). 
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diese gebunden, die sie memorieren. Wenn diese Inhalte dann wieder aufgeru- 
fen werden, geschieht dies wiederum in einem spezifischen Kontext und - 
wenn nicht durch besondere Techniken abgefedert (Reime, Bewegungen)” - 
werden die so gespeicherten Inhalte immer wieder (wenn auch nicht unbedingt 
bewusst) dem neuen Kontext angepasst, das heißt den Umständen entspre- 
chend aktualisiert. Mündlich kodiertes und übertragenes Wissen wird damit 
meist nicht „wortwörtlich“ vermittelt, sondern verändert sich. Unwichtig Ge- 
wordenes oder für unwichtig Gehaltenes wird ausgelassen und „vergessen“, 
Wichtiges wird tradiert und gegebenenfalls angepasst und erweitert. Dies hat 
zu nicht weniger komplexen Formen von Gedächtniskulturen mit eigenen kul- 
turellen Praktiken geführt, die jedoch aufgrund ihrer Kommunikationsweise 
grundsätzlich anders funktionieren.?® 

Bei der schriftlichen Kommunikation hingegen löst sich die Kommunikati- 
onssituation auf, indem die Aussagen und Informationen und damit auch das 
darin vermittelte Wissen in ein Objekt transferiert und dadurch materialisiert 
und verstetigt werden.” Das können Inschriften in Steinen sein, aber auch 
Schrift auf Pergament oder Papier, ob sie dort nun per Hand oder mit Drucklet- 
tern aufgebracht wurde. Dadurch werden die Inhalte der Kommunikation, das 
heißt zumeist die jeweiligen Texte und das damit verbundene Wissen, fixiert 
und können in genau dieser Art und Weise, also in dem gleichen Wortlaut, über 
Raum und Zeit hinweg vermittelt und in neuen Kontexten identisch wieder auf- 
gerufen werden. Auch diese Form der Kodierung, Speicherung und Vermittlung 
von Wissen ist eine eigene Kulturtechnik oder auch Technologie, die zuerst er- 
worben und erlernt werden muss und mit Schreibmaterialien und -utensilien, 
aber auch mit Archiven und Bibliotheken ihre ganz eigene Infrastruktur ver- 
langt, damit das so kodierte Wissen gesammelt und gepflegt werden kann. 

Die Konsequenzen dieses Umbruchs können nicht hoch genug eingeschätzt 
werden. Er veränderte nicht nur Umfang und Reichweite des einzelnen Kommu- 
nikationsaktes. Die damit abgelegten Inhalte konnten so zugleich gesammelt, 
verglichen, neu strukturiert und schriftlich erweitert werden. Mit der Schrift 


27 Walter Ong, Orality and Literacy: The Technologizing of the Word (London: Methuen, 1982), 
33-36, 56-66. 

28 Jan Assmann, Das kulturelle Gedächtnis: Schrift, Erinnerung und politische Identität in frü- 
hen Hochkulturen (München: C. H. Beck, 1992); Harald Weinrich, „Gedächtniskultur — Kultur- 
gedächtnis,“ in Mediengebrauch und Erfahrungswandel: Beiträge zur Kommunikationsgeschich- 
te, hg. v. Detlev Schöttker (Göttingen: Vandenhoeck und Ruprecht, 2003), 37-52. 

29 Konrad Ehlich, „Funktion und Struktur schriftlicher Kommunikation,“ in Schrift und 
Schriftlichkeit: Ein interdisziplinäres Handbuch internationaler Forschung, hg. v. Hartmut Gün- 
ther und Otto Ludwig, Bd. 1. (Berlin, New York: De Gruyter Mouton, 2008), 18-41, doi: 10.1515/ 
9783110111293.1.1.18. 
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konnten Texte und Wissen gespeichert und immer wieder neu abgerufen wer- 
den, was schließlich zu zahlreichen gesellschaftlichen und kulturellen Innova- 
tionen führte, sei es in der Wissensorganisation, im Rechtswesen (prospektives 
Recht), in der Verwaltung, in der Wirtschaft oder in der Organisation des politi- 
schen Lebens sowie politischer Institutionen. Durch diese neue Form der Spei- 
cherung von Text und Sprache haben sich letztlich auch die Sprache und das 
Denken selbst verandert.*° Dies alles, indem Sprache und Text durch Schrift in 
Objekte ausgelagert und darin fixiert wurden. 


4 Digitalisierung 


Der aktuelle Prozess der Digitalisierung ist in seiner Fundamentalität wie in sei- 
nen Konsequenzen dem der Verschriftlichung vergleichbar. Auch hier verändert 
sich ganz grundlegend die Art und Weise, wie Aussagen, Informationen und 
Wissen kommunikativ vermittelt und gespeichert werden. Denn die Schrift, um 
bei diesem Beispiel zu bleiben, wird hier nicht mehr in einem Objekt fixiert, 
sondern in digitalen Daten kodiert. Dabei handelt es sich wiederum um eine ei- 
gene Kulturtechnik und Technologie, die noch einmal völlig anders funktioniert 
als die Schrift selbst. Auch hier braucht es spezifische Utensilien und Infra- 
strukturen, was in erster Linie eine elektronische Rechenmaschine, also den 
Computer meint, der diese digitalen Daten erzeugen und bearbeiten kann. 
Ohne diesen kann Digitalität nicht funktionieren. 

Unter digitalen Daten kann man dabei im weitesten Sinne eine spezifische 
Repräsentation von Informationen verstehen, die dafür in ihre kleinsten Teile 
zerlegt und in einzelnen Zeichen repräsentiert werden. Dabei geht die zeichen- 
hafte Repräsentation der Informationen deutlich weiter als bei Schriftsystemen, 
bei denen ebenso jeder Buchstabe einen bestimmten Laut beziehungsweise jede 
als Wort zusammengefügte Zeichenfolge oder jedes Schriftzeichen eine mehr 
oder weniger bestimmte Bedeutung kodieren. Denn während Texte in der 
Schrift als Zeichensystem materiell festgeschrieben, vermittelt und durch Gele- 
senwerden wieder dekodiert werden, löst das Digitale durch eine weitere zei- 
chenhafte Repräsentationsstufe die Bindung an eine spezifische materielle Fi- 
xierung auf und virtualisiert diese. Dafür wird zum Beispiel die Schrift nach be- 


30 Zu den Konsequenzen der Schriftlichkeit vgl. Jack Goody und Ian Watt, „The Consequences 
of Literacy,“ Comparative Studies in Society and History 5 (1963): 304-345, doi: 10.1017/ 
S0010417500001730; Ong, Orality and Literacy; Jack Goody, The Logic of Writing and the Orga- 
nization of Society (Cambridge: Cambridge University Press, 1987). 
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stimmten formalen Regeln weiter kodiert, etwa in Zeichensätzen wie UTF-8, wo 
beispielsweise der Buchstabe A durch die Hexadezimalzahl 41 wiedergegeben 
wird, die dann zur konkreten Speicherung und Verarbeitung innerhalb des 
Rechners wiederum mit 01000001 in einer spezifischen Abfolge von Nullen und 
Einsen, genauer gesagt von Zuständen als Binärcode repräsentiert wird. Das 
heißt, im Digitalen ist die Schrift, die wir auf dem Monitor oder auf Ausdrucken 
sehen, nicht identisch mit der Information, die am Ende abgespeichert wird, 
sondern nur eine mögliche Darstellungsform und Interpretation der letztlich in 
Binärcode hinterlegten Daten.*! 

Anders als Schrift können die in dieser Weise kodierten Daten zwar materi- 
ell fixiert werden, müssen es aber nicht. So kann ich meine als Binärcode abge- 
legten Daten zum Beispiel als Abfolge unterschiedlicher Vertiefungen in CD- 
Roms einbrennen oder auch, dann als Schriftzeichen repräsentiert, auf Papier 
ausdrucken. Sie können aber auch so gespeichert werden, dass sie an gleicher 
Stelle immer wieder verändert und neu abgespeichert werden können. Auf der 
Festplatte zum Beispiel werden die unterschiedlichen Zustände O und 1 als Ma- 
gnetisierungen gespeichert, auf einer SSD (Solid State Disk) als elektrische La- 
dungen (die übrigens nur ungefähr zehn Jahre vorhalten). Im Rechenwerk des 
Computers selbst werden die Nullen und Einsen bzw. deren Abfolge als unter- 
schiedliche Ladungen verarbeitet und neu zusammengesetzt und können so im 
Rechner oder über Netzwerke zwischen Rechnern in Form unterschiedlicher 
Spannungen transportiert werden. Kurz gesagt, Informationen werden im Digi- 
talen als distinkte Daten repräsentiert, welche wiederum in einer Abfolge von 
zwei unterschiedlichen Zuständen kodiert werden, die ebenso materiell fixiert 
als auch einfach nur als Sequenz flüchtiger elektrischer Spannungen existieren 
können. ?? 

Die Speicherung, Verarbeitung und Anzeige von Texten in Form von Schrift 
ist nur eine mögliche Nutzung der digitalen Repräsentationsform. Schon daher 
ist die Digitalisierung nicht einfach nur eine Erweiterung der Schriftlichkeit. 
Denn im Rahmen der Digitalität kann letztlich alles, was in diskreten Werten 
als Daten repräsentiert werden kann, auch als Daten gespeichert und verarbei- 
tet werden. Es spielt also keine Rolle, ob es sich dabei um einen in Schrift ko- 
dierten Text handelt, um Bilder, Töne, Videos oder materielle Objekte. Am Ende 


31 Fotis Jannidis, „Zahlen und Zeichen,“ in Digital Humanities: Eine Einführung, hg. v. Fotis 
Jannidis, Hubertus Kohle und Malte Rehbein (Stuttgart: J.B. Metzler, 2017), 59-67, doi: 
10.1007/978-3-476-05446-3_5. 

32 Harald Klinke, „Aufbau des Computers und Vernetzung,“ in Digital Humanities: Eine Ein- 
führung, hg. v. Fotis Jannidis, Hubertus Kohle und Malte Rehbein (Stuttgart: J. B. Metzler, 2017), 
35-58, doi: 10.1007/978-3-476-05446-3_4. 
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werden all diese unterschiedlichen Modi nach dem gleichen Prinzip und in der 
gleichen Form als Daten repräsentiert und damit gespeichert, berechnet, trans- 
portiert oder auf dieser Grundlage wieder ausgegeben.” So werden zum Bei- 
spiel bei Bildern, um ein weiteres Beispiel zu nennen, diese bei der Erfassung 
als Rastergrafiken in einzelne Bildpunkte oder Pixel zerlegt und je nach Farb- 
raum (Graustufen, RGB, CMYK etc.) jedem dieser Pixel einer oder mehrere 
(Farb-)Werte zugeordnet, die dann wiederum als Zahlen und am Ende als Binär- 
code kodiert und gespeichert werden.** 

Während Schrift also in einer ganz konkreten Form (zum Beispiel Druckty- 
pen oder Schreiberhand) auf ein Objekt angebracht bzw. darin eingeschrieben 
wird und von dort wiederum vom Menschen als Schriftcode erkannt und verar- 
beitet, das heißt gelesen wird, werden im Digitalen bestimmte Informationen 
(wie der Text, aber auch Angaben zu dessen Darstellung wie Schriftart oder 
Schriftgröße) in mehreren Bearbeitungsstufen als Zeichen kodiert, die vom Men- 
schen nur noch mit Hilfe einer Maschine und entsprechenden Programmen 
nach bestimmten Regeln (Formalisierung) interpretiert werden können. 


no | 


Webseite (Desktop-Version) 
HTML-Code der Webseite 


HTML-Code in UTF-8 (Auszug) 


Abb. 1: Die Stufen der Kodierung einer Webseite von ihrer spezifischen Ausgabe fiir Desk- 
toprechner bis zum Binärcode am Beispiel der Webseite https://de.wikipedia.org/wiki/Krim 
(Zugriff am 23.03.2022). Abbildung von Torsten Hiltmann. 


33 In Medientheorien wird dieses Phänomen mit dem Begriff der Medienkonvergenz beschrie- 
ben; vgl. Friedrich A. Kittler, Grammophon, Film, Typewriter (Berlin: Brinkmann & Bose, 1986), 
7; Reichert, „Theorien digitaler Medien,“ 23-24. 

34 Malte Rehbein, ,,Digitalisierung,“ in Digital Humanities: Eine Einfiihrung, hg. v. Fotis Jann- 
idis, Hubertus Kohle und Malte Rehbein (Stuttgart: J. B. Metzler, 2017), 179-189, doi: 10.1007/ 
978-3-476-05446-3_12. 


Vom Medienwandel zum Methodenwandel —— 25 


Einen in ein materielles Objekt eingeschriebenen Text kann man daher kaum 
andern, ohne in diesem Objekt Spuren zu hinterlassen (zum Beispiel Streichun- 
gen, herausgerissene Seiten und so weiter). Im Digitalen hingegen ist die spezi- 
fische Verbindung zwischen Information und Materialitat, zwischen dem Inhalt 
und der Form seiner Darstellung aufgehoben und wird bei jeder Darstellung 
neu berechnet, so dass der Inhalt hier ohne weitere Spuren immer wieder ver- 
andert und neu arrangiert werden kann. 

Aus dem Gesagten, das die Konsequenzen der Digitalisierung fiir unseren 
Umgang mit Informationen nur anreißen kann, sollte deutlich geworden sein, 
dass wir es im Rahmen des Digitalen mit einer ganz neuen Form von Kommuni- 
kation zu tun haben, bei der sich die Grundlagen der Vermittlung und Speiche- 
rung von Informationen noch einmal ganz grundsätzlich von denen der Münd- 
lichkeit und der Schriftlichkeit unterscheiden - und damit auch unsere Mög- 
lichkeiten, mit diesen Informationen umzugehen. Dabei zeichnen sich digitale 
Daten als digitale Repräsentation von Informationen zusammenfassend durch 
folgende Eigenschaften aus: 

- Informationen werden nicht in einzelne materielle Objekte eingeschrieben, 
sondern in Informationsinfrastrukturen als Binärcode (0, 1) repräsentiert; 
sie werden elektronisch verarbeitet und oft nur flüchtig als unterschiedliche 
Spannungen bzw. Ladungen gespeichert, wodurch sie rasch verändert, aber 
auch schnell verloren gehen oder zerstört werden können. 

- Die Speicherung von Information und die konkrete Form ihrer Darstellung, 
anders gesagt: die Ebene der Daten (Datenebene) und die Ebene ihrer Prä- 
sentation (Präsentationsebene), sind distinkt, da jede menschenlesbare 
Darstellung der Informationen erst durch eine maschinengestützte Interpre- 
tation der Daten erzeugt werden muss, wozu es stets einer spezifischen In- 
frastruktur bedarf, womit die Bedingungen der Darstellung und damit auch 
deren jeweilige Form veränderlich sind. 

- Durch diese besondere Repräsentationsform der Informationen verschwim- 
men im Digitalen auf der Datenebene die Grenzen zwischen unterschiedli- 
chen medialen Formen (Text, Bilder, Video, Ton, materielles Objekt, und 
andere) beziehungsweise werden aufgehoben. 

- Digitale Daten können durch das Kopieren des Codes im Prinzip beliebig 
häufig identisch und verlustfrei reproduziert, übertragen und an anderer 
Stelle gespeichert werden. 

- Die digitalen Daten können darüber hinaus in einem vernetzten System wie 
dem Internet beliebig oft miteinander verbunden, gespeichert, bereitge- 
stellt, kopiert, aggregiert, getrennt und in unterschiedlicher und immer wie- 
der neuer Form und Zusammensetzung dargestellt werden. 


26 —— Torsten Hiltmann 


- Die Bearbeitung erfolgt dabei maschinell auf der Grundlage von Algorith- 
men, womit auch sehr umfangreiche Datenmengen unterschiedlicher Mo- 
dalität und Provenienz automatisch verarbeitet, verändert oder ausgewertet 
werden können. 


Entscheidend für uns ist, dass damit auf der Datenebene anders mit Informatio- 
nen umgegangen werden kann als in der analogen Schriftlichkeit, wo für jede 
Änderung, Umstrukturierung oder Erweiterung der materielle Datenträger mo- 
difiziert oder sogar ein neuer geschaffen werden muss. Im Digitalen hingegen 
werden Informationen flexibel gespeichert und können grundsätzlich ohne gro- 
ßen Aufwand verändert werden. Anders ausgedrückt: In einer Bibliothek sind 
alle Bücher (aber auch Videos, Schallplatten und CDs) als einzelne singuläre 
Objekte erfasst und gespeichert, zu denen man meist nur über einen Katalog 
und entsprechende Signaturen Zugang findet. Jeder dieser Datenträger ist nur 
für sich zugänglich, jeder Eingriff in die dort hinterlegten Informationen hinter- 
lässt Spuren. Im Digitalen hingegen sind all diese Informationen (ob als Texte, 
Bilder oder Musik) letztlich in der gleichen Weise als digitale Daten kodiert und 
können damit nicht nur auf der Ebene der Objekte, sondern auch auf der Ebene 
der Inhalte selbst potentiell beliebig ausgelesen, verknüpft und in unterschied- 
lichsten Kombinationen abgefragt, analysiert und verändert werden. 


5 Medienwandel zwischen medialer Aneignung 
und konzeptioneller Nutzung 


Bevor wir jedoch danach fragen, was sich daraus für die Digitalisierung in den 
Geschichtswissenschaften ableiten lässt, müssen wir zunächst noch einen wei- 
teren Aspekt des medialen Wandels näher betrachten. Denn dieser vollzieht 
sich selbstverständlich nicht auf einmal, sondern in verschiedenen Etappen. 
Dabei lassen sich anscheinend sowohl hinsichtlich des Schriftgebrauchs wie 
bei der Nutzung des Buchdrucks zwei ganz ähnliche Adaptionsschritte oder 
auch Verwendungsformen unterscheiden, die auch in Hinblick auf die Digitali- 
sierung eine Rolle zu spielen scheinen. 

So differenziert Wulf Oesterreicher zwischen einer Verschriftung und einer 
Verschriftlichung und meint damit, kurz zusammengefasst, zum einen eine me- 
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diale und zum anderen eine konzeptionelle Verwendung der Schriftlichkeit.* 
Unter dem Prozess der Verschriftung wird dabei schlicht die Transkodierung 
von Äußerungen vom phonischen ins graphische Medium verstanden, ohne 
dass sich dabei in Hinblick auf Text und Sprache konzeptionell etwas ändert. 
Gemeint sind damit beispielsweise Schwörformeln oder die Aufzeichnung von 
Zeugenaussagen, die ganz im Duktus der Mündlichkeit festgehalten und in die- 
sem Sinne auch gebraucht werden. Man könnte ebenso frühmittelalterliche Ver- 
träge nennen, in denen der Rechtsakt nur schriftlich festgehalten, nicht aber 
auch vollzogen wurde.?° 

Die Verschriftlichung hingegen beschreibt Prozesse, bei denen sich durch 
den Wechsel des Mediums zugleich konzeptionell etwas ändert, wenn dadurch 
zum Beispiel neue Sprachmittel und Gattungsformen entstehen, sich das ver- 
wendete Vokabular ausdifferenziert und erweitert und zunehmend komplexe 
Ausdrucksformen mit spezifischeren, eindeutigeren Bedeutungen, gebraucht 
werden (zum Beispiel bei Gesetzestexten).”” Damit sind vor allem Texte ge- 
meint, die gar nicht mehr zum mündlichen Vortrag, sondern zum Lesen ge- 
dacht sind. Das heißt, hier geht es um die Entwicklung der eigentlichen Schrift- 
sprache sowie ganz neuer, aus dem Medium heraus entstehender Kommunika- 
tionspraktiken und Kulturtechniken wie zum Beispiel der Verwendung von 
Kapitelüberschriften, Inhaltsverzeichnissen und Registern bei der Sammlung 
und Organisation größerer Informationsbestände.”® Schaut man sich die Inno- 
vationen und veränderten sozialen Praktiken an, die durch die erweiterte Ver- 
wendung von Schriftlichkeit entstanden sind, so sind diese vor allem mit dieser 
zweiten Adaptionsstufe der Verschriftlichung verbunden. Erst durch die schrift- 
liche Ausarbeitung komplexer Verträge und Gesetze, auf deren wortgetreue Ein- 
haltung nun geachtet und auf die immer wieder zurückverwiesen werden kann, 
konnten komplexe Rechtssysteme mit weiteren neuen Textgattungen entstehen 
(zum Beispiel Verfahrensordnungen, Rechtskommentare). In der Wirtschaft wa- 
ren nun neue Entwicklungen möglich, da mit der Buchführung neue Steue- 
rungssysteme und über Schuldbriefe und Schecks neue Finanzflüsse eingeführt 
werden konnten, die wiederum zur Grundlage neuer Institutionen wie den Ban- 


35 Wulf Oesterreicher, „Verschriftung und Verschriftlichung im Kontext medialer und konzep- 
tioneller Schriftlichkeit,“ in Schriftlichkeit im frühen Mittelalter, hg. v. Ursula Schäfer (Tübin- 
gen: Narr, 1993), 267-292. 

36 Josef Hartmann, „Urkunden,“ in Die archivalischen Quellen: Mit einer Einführung in die his- 
torischen Hilfswissenschaften, hg. v. Friedrich Beck und Eckart Henning, 3. Aufl. (Köln, Weimar 
und Wien: Böhlau, 2004), 9-39, hier: 28. 

37 Oesterreicher, „Verschriftung und Verschriftlichung,“ 272. 

38 Ivan Illich, Im Weinberg des Textes: Als das Schriftbild der Moderne entstand (München: 
C.H. Beck, 2010), 99-120. 
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ken wurden. In Konsequenz dieser konzeptionellen Schriftlichkeit sind zudem 
neue Formen der Literatur (zum Beispiel Romane), die Briefkultur oder auch 
das Konzept von Autor:innenschaft möglich geworden. All das ist erst im Rah- 
men einer konzeptionellen Schriftlichkeit entstanden, die der Logik des neuen 
Mediums folgt, sich dessen Eigenschaften zunutze macht und das Medium auch 
in diesem Sinne verwendet. 

Ähnliches lässt sich beim Buchdruck beobachten, der seinerseits den Zwi- 
schenschritt über die Inkunabeln nahm, womit die Drucke vor dem Jahr 1500 
bezeichnet werden. Denn das Ziel der frühen Buchdrucker war zunächst, mit 
der neuen Technik die gebräuchlichen Handschriften nachzuahmen, nur eben 
effizienter. Medienbedingte Innovationen erfolgten erst später. Es ging also 
auch hier anfangs darum, die neue Technologie in die hergebrachte Verwen- 
dungslogik, also das Reproduzieren von Handschriften zu integrieren. Erst zum 
Beginn des 16. Jahrhunderts verselbstständigte sich der Buchdruck, als aus dem 
Medium selbst heraus neue Nutzungsformen und Praktiken entstanden, wie 
etwa neue, ganz eigene Schrifttypen, neue Formate und vor allem das Fron- 
tispiz als Titelseite”, das über Buchinhalt, Drucker und Verleger informiert. 
Auch neue Publikationsformate wie die Einblattdrucke für die politische Kom- 
munikation haben sich erst in dieser Zeit entwickelt. Wir können auch hier in 
einem ersten Schritt eine Aneignung des neuen Mediums oder einer neuen 
Technologie feststellen, welche diese zunächst in die bekannten Gebrauchslogi- 
ken integriert, bevor es in einem weiteren Schritt tatsächlich zu konzeptionell 
neuen Verwendungsweisen kommt. Und es scheint ganz so, dass sich ein ähnli- 
ches Muster auch in Bezug auf die Digitalisierung beobachten lässt. Diese Beob- 
achtungen sollen im Folgenden dazu dienen, die Entwicklungen in den digita- 
len Geschichtswissenschaften einzuordnen. 


6 Die Digitalisierung der Geschichtswissen- 
schaften 


Wenn wir uns mit der Geschichte der Digitalen Geschichtswissenschaften befas- 
sen, wird schnell deutlich, dass wir hier in einer langen Tradition stehen. Denn 


39 Zur Geschichte der Frontispize siehe Margaret M. Smith, The Title-Page: Its Early Develop- 
ment 1460-1510 (London: The British Library & Oak Knoll Press, 2000) sowie im Detail Ursula 
Rautenberg, „Die Entstehung und Entwicklung des Buchtitelblatts in der Inkunabelzeit in 
Deutschland, den Niederlanden und Venedig - Quantitative und qualitative Studien,“ Archiv 
für Geschichte des Buchwesens 62 (2008): 1-105. 
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was wir heute als Digitalisierung verstehen, hat bereits einen Vorlauf, der bis in 
die 1960er Jahre zurtickreicht. Dabei ist die Entwicklung der Digitalen Ge- 
schichtswissenschaften stets eng mit der jeweiligen technologischen und gesell- 
schaftlichen Entwicklung verbunden. Zwar lassen sich schon fiir die Zeit vor 
1990 international über 700 Aufsätze und Publikationen zu der Frage nachwei- 
sen, wie man Computer und computerbasierte Methoden in den Geschichtswis- 
senschaften nutzen kann.“ Jedoch mussten hierfür alle Quellen und Informa- 
tionen zunächst aufwendig in digitale Daten umgewandelt werden, um diese 
dann tatsächlich auch mit einem Rechner prozessieren zu können. Mit der Ver- 
breitung des Internets und der immer tiefergreifenden Digitalisierung von Kul- 
tur und Gesellschaft hat sich auch für die Geschichtswissenschaften der Rah- 
men noch einmal grundlegend geändert. Entsprechend soll es im Folgenden 
nur um die Zeit nach 1990 gehen, für die sich analog zum oben gesagten zwei 
unterschiedliche Phasen der Digitalisierung unterscheiden lassen. 


6.1 Medialer Wandel und das Primat der Präsentation 


Die erste Phase lässt sich als eine Phase der medialen Digitalisierung beschrei- 
ben. So sind am Ende der 1990er Jahre und zu Beginn der 2000er Jahre gleich 
mehrere Projekte und Initiativen entstanden, deren Ziel es war und zum Teil 
auch heute noch ist, historisches Kulturgut wie auch eigene Text- und Daten- 
sammlungen zu digitalisieren und Nutzer:innen (womit zumeist auch Histori- 
ker:innen gemeint sind) über das Internet zugänglich zu machen. 

Bereits 1997 und damit zeitgleich mit dem Start der digitalen Bibliothek Gal- 
lica der Bibliothèque nationale de France“ und ganze acht Jahre vor der Veröf- 
fentlichung von Google Books begann das Münchener Digitalisierungszentrum 
der Bayerischen Staatsbibliothek mit der Digitalisierung von Handschriften.”? 


40 Für frühe Beiträge vgl. etwa Jerome M. Clubb und Howard Allen, „Computers and Historical 
Studies,“ Journal of American History 54/3 (1967): 599-607, doi: 10.2307/2937409; Vern L. Bull- 
ough, „The Computer and the Historian: Some Tentative Beginnings,“ Computers and the Hu- 
manities 1/3 (1967): 61-64, doi: 10.1007/BF00119888; oder auch Carl August Lückerath, „Pro- 
legomena zur elektronischen Datenverarbeitung im Bereich der Geschichtswissenschaft,“ His- 
torische Zeitschrift 207 (1968): 265-296, doi: 10.1524/hzhz.1968.207.jg.265. 

41 Emmanuelle Bermés, „La BNF face au numérique: De nouveaux objets patrimoniaux“, Re- 
vue de la Bibliothéque nationale de France 61 (2020): 163-167. 

42 Markus Brantl und Astrid Schoger, „Das Münchener Digitalisierungszentrum zwischen Pro- 
duktion und Innovation,“ in Information, Innovation, Inspiration: 450 Jahre Bayerische Staats- 
bibliothek, hg. v. Rolf Griebel und Klaus Ceynowa (Miinchen: Saur, 2008), 253-280, doi: 
10.1515/9783598440892.4.253. 
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Ein Jahr später publizierten die Regesta Imperii ihre ersten Regesten digital auf 
CD-Rom und begannen 2001 damit, alle bereits erschienen Bande zu retrodigita- 
lisieren und in digitaler Form über das Internet bereitzustellen.” 2001 war zu- 
gleich der Beginn des sehr ambitionierten und weitreichenden Projekts der Ma- 
nuscripta Mediaevalia, das Handschriftendigitalisate und vor allem Handschrif- 
tenkataloge aus deutschen Bibliotheken erschloss.”* Ebenfalls im Jahr 2001 
wurde das Prometheus-Bildarchiv gegründet“. 2004 begannen die Monumenta 
Germaniae Historica mit der Digitalisierung und Bereitstellung ihrer Editionen 
als dMGH über das Internet.“° Diese Entwicklung setzte sich in den letzten Jah- 
ren mit immer weiteren Angeboten fort, begleitet von zentralen Portalen wie 
der Deutschen Digitalen Bibliothek“, der Europeana“®, dem Archivportal-D*’, 
dem Deutschen Zeitungsportal”° oder dem Handschriftenportal?', die die von 
verschiedenen Institutionen bereitgestellten Daten und Digitalisate sammeln 
und gemeinsam durchsuchbar zugänglich machen. 

Auch wenn hier viele mediävistische Großprojekte genannt wurden, mag 
diese Zeitreihe und vor allem die damit beschriebene Entwicklung in ähnlicher 
Form auch für die anderen geschichtswissenschaftlichen Epochen gelten. Nach 
mittlerweile 20 Jahren stehen dem Fach, so lässt sich festhalten, Millionen Da- 
tensätze, digitalisierte Bilder, Handschriften und Objekte, Editionen, Texte und 
Regesten, Katalogeinträge und Findmittel digital über das Internet zur Verfü- 


43 Paul-Joachim Heinig, „Die Herausforderung der ‚Neuen Medien‘ (CD-Rom, Bildplatte und 
Internet): Zukünftige Gestaltungsfragen und Publikationsformen am Beispiel der Regesta Impe- 
rii,“ in Die Regesta Imperii im Fortschreiten und Fortschritt, hg. v. Harald Zimmermann (Köln, 
Weimar und Wien: Böhlau, 2000), 129-148. 

44 Robert Giel, „Manuscripta mediaevalia‘: Handschriften aus deutschen Bibliotheken im In- 
ternet,“ Gazette du livre medieval 39 (2001): 34-40. 

45 „Vom Projekt zum Verein — Die Geschichte von prometheus | Das prometheus-Bildarchiv: 
Hochwertige Bilder zu Kunst, Kultur und Geschichte,“ Prometheus. Das verteilte digitale Bild- 
archiv für Forschung und Lehre, https://www.prometheus-bildarchiv.de/about/project_history. 
Zugriff am 15.12.2021. 

46 Bernhard Assmann und Patrick Sahle, Digital ist besser: Die Monumenta Germaniae Histo- 
rica mit den dMGH auf dem Weg in die Zukunft - eine Momentaufnahme (Köln: Universität zu 
Köln, 2008), urn:nbn:de:hbz:38-23179. 

47 „Deutsche Digitale Bibliothek - Kultur und Wissen online“, https://www.deutsche-digitale- 
bibliothek.de/. Zugriff am 15.12.2021. 

48 „Europeana - Discover Inspiring European Cultural Heritage“, https://www.europeana.eu/ 
en. Zugriff am 15.12.2021. 

49 „Archivportal-D“, https://www.archivportal-d.de/. Zugriff am 15.12.2021. 

50 „Deutsches Zeitungsportal — Deutsche Digitale Bibliothek“, https://www.deutsche-digitale- 
bibliothek.de/newspaper. Zugriff am 02.12.2021. 

51 „Handschriftenportal“, https://handschriftenportal.de/. Zugriff am 15.12.2021. 
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gung (schon allein das Archivportal-D umfasst die Beschreibungen von 24 Mio. 
Archivstücken, davon 1,3 Mio. mit Digitalisat®”). Blickt man noch etwas allge- 
meiner auf die Frage der Digitalisierung der Geschichtswissenschaften, sind na- 
türlich auch die zahlreichen genuin digitalen Quellen hinzuzufügen, die spates- 
tens seit den 1990er Jahren immer wichtiger werden und die die historische Ar- 
beit in der Zeitgeschichte mehr und mehr prägen, angefangen bei digitalem 
Verwaltungsarchivgut und offiziell bereitgestellten Daten (zum Beispiel govDa- 
ta”), wie sie aktuell zum Beispiel in der Corona-Krise eine Rolle spielen, über 
vielfältige Quellen wie Zeitungen, Fernsehsendungen, Internetportale, Blogs 
und Podcasts, E-Mails und Kurzmitteilungen (wie die berühmten SMS der frühe- 
ren Bundeskanzlerin Angela Merkel) bis hin zu den wohlbekannten Social-Me- 
dia-Kanälen wie jenen auf Twitter, die mittlerweile selbst Teil des Regierungs- 
handelns sind.** Damit steht eine fast unüberschaubare und zum Teil äußerst 
prekäre Menge an digitalen Quellen - und damit letztlich auch an Daten - für 
die Auswertung zur Verfügung. 


6.2 Persistenz der analogen Gebrauchslogik 


Bislang wird für die Auswertung dieser Quellen jedoch meist nur die Präsentati- 
onsebene genutzt. Diese wandelt die in den Daten repräsentierten Informatio- 
nen wieder in eine Form um, die sie uns — nach dem Vorbild ihrer materiellen 
Vorlagen, oder zumindest deren Gebrauchslogik folgend - am Rechner darstellt 
oder abspielt. Durch die Anzeige am Bildschirm, das Abspielen als Ton oder als 
Ausdruck auf Papier werden diese Informationen, oder zumindest ein Teil da- 
von, wieder in analoge Signale umgewandelt und bereitgestellt. Digitalität und 
Internet werden vor allem als bequeme Speicher und schnelle Kommunikati- 
onsmittel verstanden, die es uns erlauben, Texte und Handschriften auch au- 
ßerhalb der Bibliotheken und Archive zu konsultieren, ohne dabei deren Öff- 
nungszeiten und andere Limitierungen wie die Anzahl der täglich erlaubten Do- 
kumente berücksichtigen zu müssen. Dabei werden die digitalen Medien 
weitgehend in einen analogen Gebrauchszusammenhang integriert und die so 
repräsentierten Inhalte in der gleichen Weise verwendet wie vor ihrer Digitali- 


52 „Archivportal-D“, https://www.archivportal-d.de/. Zugriff am 15.12.2021. 

53 „GovData | Datenportal für Deutschland“, GovData, https://www.govdata.de. Zugriff am 
15.12.2021. 

54 Frederic Clavert, „History in the Era of Massive Data: Online Social Media as Primary 
Sources for Historians,“ Geschichte und Gesellschaft 47/1 (2021): 175-194, doi: 10.13109/ 
gege.2021.47.1.175. 
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sierung. Das heißt, selbst wenn sie als Daten vorliegen und übermittelt werden, 
werden Texte weiterhin als Texte gelesen, Bilder weiterhin als Bilder gesehen, 
Audioaufzeichnungen als Audioaufzeichnungen gehört und Filme als Filme ge- 
schaut. Für die Bearbeitung dieser Quellen und Informationen wird weiterhin 
auf die gleichen Analysemethoden zurückgegriffen wie zuvor im Analogen. Fr- 
weiterung erfährt die Bearbeitung höchstens in der Form von Volltextsuchen, 
die eine schnellere Orientierung im Text erlauben. Der damit einhergehende 
Bruch zwischen Original und Digitalisat wird jedoch nur selten reflektiert.” Da- 
bei ist dieser — wie weiter oben beschrieben - erheblich. Ein Digitalisat ist keine 
Kopie und kein Faksimile; es ist ein Modell, das nur ausgewählte Eigenschaften 
der Vorlage in Daten überträgt, aus denen dann für jede Ausgabe nach be- 
stimmten Vorgaben und abhängig vom jeweiligen System, dem konkreten Aus- 
gabegerät und der Software eine neue (Teil-)Darstellung produziert beziehungs- 
weise simuliert wird. Dafür greifen wir auf Programme wie Adobe Acrobat 
(PDF), Media Player (Video, Audio), DFG-Viewer (Handschriftendigitalisate), 
Blender (3D-Modelle) oder Browser wie Chrome und Firefox (unter anderem 
Textdaten und Bilder) zurück, die die in den Daten enthaltenen Informationen 
aufnehmen, verarbeiten und in einer jeweils spezifischen Art und Weise in jene 
analoge Darstellung umwandeln, auf die wir dann für unsere Analysen zurück- 
greifen. 

Einen ähnlichen Filter und eine erhebliche Einschränkung im Zugang zu 
den Daten bilden auch die verschiedenen graphischen Benutzeroberflächen, 
die den Nutzer:innen auf der Präsentationsebene Zugang zu den in den Daten 
gespeicherten Informationen gewähren und einen Teil davon für den analogen 
Zugang (lesen, sehen, hören) aufbereiten. Dabei vereinfachen sie einerseits die 
Suche nach bestimmten Informationen und strukturieren den Nutzer:innen die 
Ergebnisse vor, womit sie ihnen Orientierung in der Menge an potentiellen In- 
formationen bieten. Andererseits schränken sie damit aber auch den Zugang zu 
den in den Daten repräsentierten Informationen erheblich ein und ermöglichen 


55 Siehe hierzu Michael Bender, Thomas Kollatz und Andrea Rapp, „Objekte im digitalen Dis- 
kurs: Epistemologische Zugänge zu Objekten durch Digitalisierung und diskursive Einbindung 
in virtuelle Forschungsumgebungen und -infrastrukturen,“ in Objektepistemologien: Zur Ver- 
messung eines transdisziplinären Forschungsraums, hg. v. Markus Hilgert, Henrike Simon und 
Kerstin P. Hofmann (Berlin: Edition Topoi, 2018), 107-132, doi: 10.17171/3-59; Andreas Fickers, 
„Digitale Metaquellen und doppelte Reflexivität,“ in Historische Grundwissenschaften und die 
digitale Herausforderung, hg. v. Rüdiger Hohls, Claudia Prinz und Eva Schlotheuber (Berlin: 
Clio-Online und Humboldt-Universität zu Berlin, 2016), 52-57, doi: 10.18452/18771, sowie Pas- 
cal Föhr, Historische Quellenkritik im digitalen Zeitalter, E-humanities (Glückstadt: VWH Verlag 
Werner Hülsbusch, 2019), doi: 10.5451/unibas-006805169. 


Vom Medienwandel zum Methodenwandel —— 33 


nur jene Nutzungsszenarien, fiir die die Benutzeroberflache konzipiert wurde 
beziehungsweise umgesetzt werden konnte. 

Diese Zugänge auf der Präsentationsebene waren lange Zeit die einzige 
Möglichkeit, die die Anbieter entsprechender Daten bereitgestellt haben, um 
mit den Daten zu interagieren. So war esin den verschiedenen Zeitungsportalen 
lange Zeit nur möglich, die verschiedenen digitalisierten Ausgaben online zu 
durchblättern und die jeweils interessierenden Seiten anzuschauen und im Be- 
darfsfall einzeln herunterzuladen, was sich in den letzten Jahren glücklicher- 
weise grundlegend geändert hat.” Mittlerweile liegen die Zeitungen meist per 
OCR bearbeitet auch als Volltext vor und können - mit Einschränkungen - über 
den gesamten Bestand hin nach bestimmten Begriffen durchsucht werden. Die 
Ergebnisse verlinken meist auf die jeweiligen Seiten, die dann wiederum als 
Bild ausgegeben werden, um die jeweiligen Fundstellen im Kontext betrachten 
zu können. Zwar kann man sich den erkannten Volltext anzeigen lassen und 
die Fundstelle entweder als Volltext oder als bildbasierte PDF herunterladen. 
Auch kann man die Wiedergabe der Digitalisate auf unterschiedliche Weise ver- 
ändern, um sie am Bildschirm lesbarer zu machen. Was man bislang jedoch 
nicht herunterladen konnte, waren die Text- oder Bilddaten selbst, die diesen 
Präsentationen zugrunde liegen, um diese eigenständig mit entsprechenden 
Analysemethoden bearbeiten zu können - und sei es nur für bestimmte Titel 
oder Zeitabschnitte.”” Die Präsentationsebene beziehungsweise graphische Be- 
nutzeroberfläche bleibt damit die einzige Ebene, auf der man mit den digital re- 
präsentierten Quellen interagieren kann. 

Noch deutlicher kann man das bei der wichtigen und schon etwas älteren 
Publikation der Verhandlungen des Deutschen Reichstags und seiner Vorläufer 
beobachten.” Auch hier können die Nutzer:innen allein über das graphische 
Benutzerinterface der Webseite mit den Daten interagieren. Man kann die er- 


56 Vgl. zum Beispiel die Zeitungsportale „ANNO - Austrian newspaper Online“ der Österrei- 
chischen Nationalbibliothek (https://anno.onb.ac.at/) und „Zeitungsportal NRW“ der Univer- 
sitäts- und Landesbibliotheken in Bonn und Münster (https://zeitpunkt.nrw/). Zugriff jeweils 
am 15.12.2021. 

57 Seit Oktober 2021 bietet die Deutsche Digitale Bibliothek mit dem „Deutschen Zeitungspor- 
tal“ (https://ddb.de/newspaper) jedoch einen Aggregierungsservice an, der die über verschie- 
dene Institutionen und Webangebote verteilten digitalisierten historischen Zeitungsbestände 
gemeinsam durchsuchbar und abrufbar macht. Hier können die so aggregierten Daten seit kur- 
zem auch über die Schnittstelle (API) der DDB (https://labs.deutsche-digitale-bibliothek.de/ 
app/ddbapi/) direkt auf der Datenebene angesprochen werden (Dokumentation: https://api. 
deutsche-digitale-bibliothek.de/OpenAPI). Zugriff jeweils am 15.12.2021. 

58 „Datenbank der deutschen Parlamentsabgeordneten 1867-1938“, Bayerische Staatsbiblio- 
thek, https://www.reichstag-abgeordnetendatenbank.de/. Zugriff am 15.12.2021. 
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schlossenen Texte zwar im Volltext durchsuchen, doch wird fiir die Fundstellen 
nur das Bild der jeweiligen Seite angezeigt. Gleiches geschieht, wenn man die 
Datenbank mit den detaillierten Einträgen zu den 5.211 Abgeordneten aus der 
Zeit zwischen 1867 und 1942 konsultiert. Hier kann man mit einer sehr prakti- 
schen und detaillierten Abfrage die gesamte Datensammlung durchsuchen, die 
daraus resultierenden Ergebnisse jedoch nur über die Ergebnisanzeige nutzen. 
Diese verweist entweder via Link auf die nicht durchsuchbaren Digitalisate des 
Parlamentsalmanachs beziehungsweise der Parlamentsprotokolle oder aber auf 
deren jeweilige Transkription. Die umfangreichen strukturierten Daten, die der 
Datenbank zugrunde liegen (unter anderem Berufsfeld, Konfession, Wahlperi- 
ode, Partei), hingegen sind bislang nicht abrufbar und damit auch nicht eigen- 
ständig auswertbar. An eine weitere Verwendung dieser umfangreichen Daten 
durch die Nutzer:innen selbst ist nicht gedacht. Sie dienen nur als Findmittel 
für eine dynamische Zusammenstellung von Texten und Digitalisaten, damit 
diese einzeln am Monitor gelesen werden können. 

Dies lässt sich schließlich auch bei digitalen Editionen beobachten, wo die 
Texte zwar für die Präsentation über entsprechende Portale aufwendig aufberei- 
tet und für diese verschiedenen Darstellungs- und damit Nutzungsszenarien be- 
reitgestellt werden, von denen man ausgeht, dass sie für die Nutzer:innen nütz- 
lich sind. Doch wird hier ebenfalls meist davon ausgegangen, dass diese den 
Text, wie bei herkömmlichen Editionen als Buch, jetzt eben am Bildschirm le- 
sen werden. Die mühsam aufbereiteten Daten der Edition, die ähnlich wie die 
Daten zu den Reichstagsabgeordneten von den Nutzenden selbst noch einmal 
auf ganz eigene und kreative Art mit digitalen Methoden und Tools ausgewertet 
werden könnten, werden jedoch selbst nicht bereitgestellt. In dem von Greta 
Franzini kuratierten Katalog digitaler Editionen”? kann man sehen, dass gerade 
einmal für 70 der 179 in TEI/XML ausgeführten Editionen auch die zugrundelie- 
senden Daten zum Download angeboten werden. Für alle anderen bleibt die 
Präsentationsebene die einzige Möglichkeit zur Interaktion mit den bereitge- 
stellten Informationen. 


6.3 Konzeptioneller Wandel und das Primat der Daten 


Damit bleiben die Möglichkeiten, mit den umfangreich digitalisierten Quellen 
und digital verfügbaren Daten umzugehen, bei den meisten Angeboten auf eine 
Art der Interaktion begrenzt, die der gewohnten analogen Gebrauchslogik folgt. 


59 „Catalogue Digital Editions“, Greta Franzini, https://dig-ed-cat.acdh.oeaw.ac.at/. Zugriff 
am 15.12.2021. 
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Abb. 2: Mediale und konzeptionelle Digitalität am Beispiel geschichtswissenschaftlicher Quel- 
len und Informationen. Abbildung von Torsten Hiltmann. 


Die Quellen und Informationen werden zwar digital repräsentiert gespeichert, 
als solche aber in den herkömmlichen analogen Gebrauchszusammenhang ein- 
gegliedert, der davon ausgeht, dass sie wie Bücher, Dias oder Tonbänder für die 
historische Analyse gelesen, gesehen oder gehört werden, entsprechend der 
fest etablierten klassischen Hermeneutik. Dabei, und das ist die zentrale Fest- 
stellung, die ich hier machen möchte, bieten uns die oben skizzierten Eigen- 
schaften des Digitalen viele Möglichkeiten, unseren Zugang zu diesen Quellen 
und unsere Analyse- und Interaktionsmöglichkeiten um weitere Methoden zu 
ergänzen. Oder anders gesagt: Wenn die verschiedenen geschichtswissenschaft- 
lichen Quellen und Informationen bereits als digitale Daten vorliegen, können 
wir sie auch auf der Datenebene selbst auswerten. Denn diese gewährt uns ei- 
nen ungleich umfassenderen und flexibleren Zugriff auf die in den Daten reprä- 
sentierten Informationen, die wir für unsere Auswertung immer wieder neu zu- 
sammenstellen, kombinieren und erweitern können, und dies auch über ver- 
schiedene Datenquellen hinweg. Darüber hinaus bietet diese besondere 
Repräsentationsform des Digitalen die Möglichkeit, verschiedene Analyseschrit- 
te formalisiert in eine Liste von Handlungsanweisungen (Algorithmen) zu über- 
führen und diese maschinell ausführen zu lassen, womit auch sehr große, sonst 
nicht handhabbare Datenmengen ausgewertet werden können. Zugleich wer- 
den unsere Forschungen damit transparenter und reproduzierbar. Auf diese 
Weise können wir in einem kritisch reflektierten Adaptionsprozess weiterfüh- 
rende Methoden und Verfahren für unser Fach nutzbar machen, wie sie in der 
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Informatik und den Digital Humanities fiir verschiedene Analyseschritte bereits 
etabliert sind. 

Ich möchte das abschließend an drei kleinen Beispielen demonstrieren. Das 
erste zeigt dabei geradezu idealtypisch den Weg von der analogen über die digi- 
talisierte zur digitalen Forschung in den Geschichtswissenschaften. Ausgangs- 
punkt sind die Germania Sacra, ein Verzeichnis von kirchlichen Personen und 
Institutionen im Alten Reich, das seit 1929 als Publikationsreihe in gedruckter 
Form erschien. Diese Bände wurden seit 2008 retrodigitalisiert und als PDF 
über das Internet bereitgestellt, außerdem wurden die Personenregister der ein- 
zelnen Bände in einer Datenbank erfasst und damit über die verschiedenen 
Bände hinweg gemeinsam abfragbar gemacht.‘ Die Datenbank kann über die 
Website des Projekts genutzt und auf diese Weise zum Beispiel eine Liste mit 
allen Domherren erstellt werden, die zwischen 1350 und 1520 am Domstift in 
Münster nachweisbar sind - was am Ende eine Liste von 196 Personen ergibt. 
Möchte man nun herausfinden, wie die Vernetzung der Münsteraner Domher- 
ren zu kirchlichen Institutionen in anderen Städten aussah, indem man unter- 
sucht, an welchen anderen Institutionen außerhalb Münsters sie in ihrer Karrie- 
re Ämter innehatten und wie sich diese über die Zeit entwickelte, kann man 
sich für jeden einzelnen dieser Domherren dessen Ämterlaufbahn anzeigen las- 
sen und diese 196 Einzeleinträge mit ihren Listen auswerten. Oder aber man 
kann das Angebot des Projekts annehmen und diese Abfrage über die API (Pro- 
grammierschnittstelle) stellen®! beziehungsweise die Ergebnisliste der Abfrage 
über die graphische Benutzeroberfläche als Daten herunterladen. Diese kann 
man daraufhin weiter bearbeiten und so umstrukturieren, dass man sich die in 
den Daten enthaltenen Informationen in einer raumzeitlichen Visualisierung 
ausgeben lässt. Durch die Bearbeitung und Umstrukturierung der Daten mit ein 
paar einfachen Operationen lassen sich auch größere Datenbestände rasch aus- 
werten und mögliche Muster und Entwicklungen aufzeigen, die dann am Mate- 
rial selbst näher geprüft werden können. Auf der Grundlage der zur Verfügung 


60 Bärbel Kröger und Christian Popp, „Das Forschungsportal Germania Sacra Online: Der Weg 
in die digitale Zukunft,“ in 100 Jahre Germania Sacra: Kirchengeschichte schreiben vom 16. bis 
zum 21. Jahrhundert, hg. v. Hedwig Röckelein (Berlin, Boston: De Gruyter Akademie Forschung, 
2018), 135-148, doi: 10.1515/9783110619584-007. 

61 Die Filterkriterien können dabei einfach als Parameter über die URL übergeben werden, 
wie das Beispiel zeigt: http://personendatenbank.germania-sacra.de/api/v1.0/person?query 
[O][field]=person.belegdaten&query[O][value]=1521&query[0][operator]=lower&query[O][con 
nector]=and&query(1][field]=person.belegdaten&query[1][value]=1349&query[1][operator]=grea 
ter&query[1][connector]=and&query[2][field]=amt.institution&query[2][value]=Domstift%20M 
%C3%BCnster&query[2][operator]=like&query[2][connector]=and&query[3][field]=bezeich 
nung&query[3][value]=Domherr&query[3][operator]=like&offset=0&limit=500&format=turtle. 
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stehenden Daten lässt sich hier mit ein paar Handgriffen zeigen, dass das Äm- 
ternetzwerk der Münsteraner Stiftsherren im untersuchten Zeitraum zunächst 
deutlich überregional ausgeprägt war, was sich jedoch spätestens ab 1450 än- 
derte, wonach nur noch regionale Vernetzungen sichtbar sind. Die Veränderun- 
gen scheinen im Netzwerk mit der Münsteraner Stiftsfehde und demnach mit 
einem einschneidenden Ereignis in der Münsteraner Geschichte zusammenzu- 
hängen. Damit haben wir statt auf der Präsentationsebene zu bleiben mit den 
über die Schnittstelle des Datenbankportals bereitgestellten Daten selbst gear- 
beitet und diese zur Grundlage unserer Untersuchung gemacht. 

Vergleichbare Beispiele lassen sich ebenso für die direkte Arbeit mit Text- 
quellen sowie mit Bildern finden. So könnte man beispielsweise für die Frage, 
in welcher Weise Raimund von Aguilers in seiner Historia Francorum bei der 
Schilderung der Freignisse auf dem Ersten Kreuzzug auf die Bibel zurückgriff, 
den Quellentext einzeln durcharbeiten und sich dabei auf die eigene Kenntnis 
der Bibel stützen, die - wie Robert Huygens anmahnte - ein guter Editor mehr 
als einmal komplett gelesen haben sollte.°° Man kann aber statt mit der Anzeige 
als PDF oder als Onlinepräsentation auch auf der Datenebene mit diesen Texten 
arbeiten und diese Forschungsfrage unter Rückgriff auf die Methoden der text 
reuse analysis bearbeiten.‘ Gleiches gilt beispielsweise auch für die Suche nach 
Wappendarstellungen in mittelalterlichen Handschriften. Auch hier könnte 
man jedes Manuskript als Digitalisat aufrufen und auf der Suche nach entspre- 
chenden Abbildungen virtuell durchblättern. Oder man kann auf die zugrunde 
liegenden Daten zurückgreifen und mit Hilfe von Verfahren des maschinellen 
Lernens aus der computer vision ein Modell trainieren, mit dem sich die Wap- 
pendarstellungen automatisiert über die Bilddaten eines größeren Korpus hin- 
weg auffinden lassen.™ 
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7 Von einer digitalisierten zu einer digitalen 
Geschichtswissenschaft 


Vergleicht man also die Entwicklungen in den Geschichtswissenschaften mit 
dem, was wir sowohl beim Prozess der Verschriftlichung als auch bei der Ein- 
fiihrung des Buchdrucks mit beweglichen Lettern gesehen haben, kann man 
auch hier davon sprechen, dass dieser Prozess in zwei Etappen verlauft. Zu- 
nächst die Aneignung des neuen Mediums (mediale Digitalität), bei der anfäng- 
lich nur die mediale Ebene gewechselt wird, der konkrete Gebrauch sich aber 
weiter an den hergebrachten, das heißt hier: analogen Gebrauchslogiken orien- 
tiert - ganz wie bei der Verschriftung. Das neue digitale Medium wird zunächst 
einmal in die gewohnten Gebrauchszusammenhänge integriert. Dem folgt eine 
weitere Stufe, in deren Rahmen sich der Gebrauch dieser neuen Technologien 
tatsächlich an den Bedingungen der Digitalität und damit an den oben aufge- 
führten Eigenschaften digitaler Daten selbst orientiert (konzeptionelle Digitali- 
tät). Erst hieraus entsteht eine neue, spezifisch digitale Gebrauchslogik. Auch 
wenn sich die Geschichtswissenschaften, wie am Anfang demonstriert, im Rah- 
men der Digitalisierung schon erheblich gewandelt haben, können durch die 

Verwendung digitaler Methoden, die dieser neuen datenbasierten Gebrauchslo- 

gik folgen, den herkömmlichen Methoden noch einmal neue Perspektiven hin- 

zugefügt werden. Ein Prozess, bei dem wir als Historiker:innen jedoch erst am 

Anfang stehen. 

Aus dieser Beobachtung lassen sich meines Erachtens mehrere Konsequen- 
zen und Aufgaben für die Digitalen Geschichtswissenschaften ableiten. Denn 
die unhintergehbare Grundlage dieser Entwicklung sind digitale Daten oder, ge- 
nauer gesagt, digitale Forschungsdaten - die wir noch deutlich besser verste- 
hen müssen als bisher und die wir neben den Quellen selbst in den Mittelpunkt 
unserer Arbeit stellen sollten. 

1. Data First: Das bedeutet, dass wir darüber nachdenken müssen, inwieweit 
die Geschichtswissenschaften oder mindestens die digitalen Geschichtswis- 
senschaften eine starke und klare Datenkultur herausbilden müssen. Zen- 
tral hierfür wäre das Data-First-Prinzip, das meint, dass man die Daten in 
den Mittelpunkt stellt und zur Grundlage des digitalen Arbeitens macht, an- 
stelle der verschiedenen Applikationen und unterschiedlichen Repräsenta- 
tionsformen, die auf diesen Daten aufbauen. Ganz ähnlich wie in anderen 
gesellschaftlichen Bereichen sollten im Zeitalter der Digitalität auch in den 
Geschichtswissenschaften die Daten im Zentrum stehen. Erst dadurch kön- 
nen wir die Erkenntnispotentiale nutzen, die uns über dieses neue Medium 
zur Verfügung stehen und die wir brauchen, um die großen Mengen an di- 
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gitalisierten oder genuin digitalen Daten handhabbar zu halten und pro- 
duktiv zu nutzen. Dafiir aber miissten, und das ware die fundamentale Vor- 
aussetzung, die verschiedenen Projekte und Institutionen die bei ihnen 
produzierten Daten nicht nur auf der in ihrer Nutzbarkeit begrenzten Pra- 
sentationsebene publizieren, sondern zum Beispiel über Schnittstellen oder 
in Form von data dumps zugleich unter Befolgung der FAIR-Prinzipien als 
(Forschungs-)Daten bereitstellen. 

2. Methodenentwicklung und Methodenreflexion: Wie wir gesehen haben, 
basiert die Priorisierung der Daten auf einer neuen digitalen Gebrauchslo- 
gik, die sich aus den Eigenschaften der Daten und deren Prozessierung er- 
gibt, die wir noch viel besser verstehen müssen. Dies gilt vor allem für die 
neuen methodischen Möglichkeiten, die damit verbunden sind. Denn um 
die Daten angemessen nutzen zu können, brauchen wir eine entsprechende 
Methodenentwicklung und eine kritische Methodenreflexion aus der spezi- 
fischen Perspektive der Geschichtswissenschaften. Es geht darum, zu ver- 
stehen, wie wir in der historischen Forschung die uns zur Verfügung ste- 
henden Daten nutzen können, gleichzeitig jedoch immer aus der Perspek- 
tive unseres Faches reflektieren, was bei der Anwendung der Methoden in 
den einzelnen Schritten mit den Daten und den darin enthaltenen Informa- 
tionen geschieht, um sicherzustellen, dass diese Methoden und die Art und 
Weise, wie sie eingesetzt werden, auch aus geschichtswissenschaftlicher 
Perspektive zu sauberen und validen Ergebnissen führen. 

3. Theorieentwicklung: Was wir drittens brauchen, um im Rahmen dieses 
Wandels tatsächlich gute Methoden zu entwickeln, ist eine vertiefte Aus- 
einandersetzung mit Digitalität und Epistemologie und darauf aufbauend 
eine entsprechende Theorieentwicklung. Denn eine reine Übernahme fach- 
fremder Methoden reicht nicht aus; sie müssen auch in Hinblick auf die 
theoretischen und methodischen Grundlagen der Geschichtswissenschaf- 
ten geprüft und an diese angepasst werden. Dafür aber müssen wir die 
Grundlagen unseres Faches gut kennen, auch unter den Bedingungen der 
Digitalität. Das bedeutet, wir brauchen ein noch klareres Verständnis da- 
für, wie historische Forschung funktioniert und wie sie sich durch Digitali- 
tät verändert. Wir müssen verstehen, wie historisches Wissen produziert 
wird, wie wir historische Daten repräsentieren und analysieren, wie wir 
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aber auch mit Unsicherheiten und Ambiguitäten umgehen, um am Ende ei- 
nes digitalen Prozesses verlässliche und vor allem kritisch überprüfbare 
und belastbare Ergebnisse zu erhalten. Das bedeutet ferner, dass wir noch 
genauer reflektieren müssen, was Digitalität selbst meint und wie diese Art 
der Speicherung und Kommunikation von Wissen und Information in Form 
von Daten unsere Gesellschaft und letztlich auch unsere Geschichte ganz 
grundsätzlich beeinflusst und verändert. 


Es ist schon ein Paradox. Auf der einen Seite schaut die digitale Geschichtswis- 
senschaft bereits auf eine fast 60-jährige Geschichte zurück. Zugleich ist aber 
immer wieder, auch heute, das Gefühl verbreitet, erst am Anfang einer Entwick- 
lung zu stehen. Der Blick in die Geschichte der Verschriftlichung und in die Ent- 
stehung des Buchdrucks konnte hoffentlich zeigen, dass es sich bei den aktuel- 
len Entwicklungen jedoch nicht um etwas Neues, sondern nur um eine weitere 
Etappe in einem längeren Prozess handelt, den wir auf Grundlage dieses Wis- 
sens aktiv mitgestalten können. 

Die Feststellung, dass sich die tatsächlichen Potentiale neuer Medien und 
Technologien ihren Nutzer:innen erst allmählich erschließen, lässt sich letzt- 
endlich auch auf die mit der Digitalisierung der Geschichtswissenschaften ein- 
hergehenden neuen Techniken und Methoden übertragen. So ließe sich auch 
erklären, warum die gern gestellte Frage nach besonders herausragenden Fr- 
gebnissen, die mit den neuen digitalen Methoden erbracht wurden, um diese zu 
überhaupt zu legitimieren,° in dieser Weise gar nicht zu beantworten ist. Denn 
auch hier gilt, dass man sich diese Methoden zunächst einmal Stück für Stück 
aneignen, sie erforschen und vor allem anwenden muss, um erkennen zu kön- 
nen, welche tatsächlichen Potentiale damit verbunden sind. 
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Andreas Fickers 


What the D does to history 


Das digitale Zeitalter als neues historisches Zeitregime? 


Abstract: The digital interferes in multiple ways in our current day practice of 
history. This article argues that it not only impacts the way we search, store, 
analyze, and visualize historical sources and how we tell our stories, but the 
dynamic, real-time, and connected nature of digital research infrastructures 
and the Internet has a deep influence on how we think about history. As a new 
temporal regime, the digital age shapes our memory practices and changes the 
way we imagine and experience the past. By mobilizing the concept of digital 
hermeneutics, the chapter proposes a conceptual framework that helps to un- 
derstand the various interferences of the ,,D“ and to use the critical potential of 
humanities to deconstruct and contextualize our data-driven present. 


Keywords: digital hermeneutics, time regime, hyperconnectivity, data visualiza- 
tion, real time, aura 


Zusammenfassung: Das Digitale greift auf vielfaltige Weise in unsere heutige 
Geschichtspraxis ein. In diesem Artikel wird argumentiert, dass es sich nicht 
nur auf die Art und Weise auswirkt, wie wir historische Quellen suchen, spei- 
chern, analysieren und visualisieren und wie wir unsere Geschichten erzählen, 
sondern dass die dynamische, in Echtzeit ablaufende und vernetzte Natur der 
digitalen Forschungsinfrastrukturen und des Internets einen tiefgreifenden Ein- 
fluss darauf hat, wie wir über Geschichte denken. Als neues zeitliches Regime 
prägt das digitale Zeitalter unsere Erinnerungspraktiken und verändert die Art 
und Weise, wie wir uns die Vergangenheit vorstellen und wie wir Geschichte 
erleben. Unter Verwendung des Konzepts der digitalen Hermeneutik schlägt 
das Kapitel einen konzeptionellen Rahmen vor, der hilft, die verschiedenen In- 
terferenzen des „D“ zu verstehen und das kritische Potenzial der Geisteswissen- 
schaften zu nutzen, um unsere datengesteuerte Gegenwart zu dekonstruieren 
und zu kontextualisieren. 


Schlagwörter: Digitale Hermeneutik, Zeitregime, Hyperkonnektivität, Datenvi- 
sualisierung, Echtzeit, Aura 


3 Open Access. © 2022 Andreas Fickers, published by De Gruyter. [COVER Dieses Werk ist lizensiert un- 
ter einer Creative Commons Namensnennung 4.0 International Lizenz. 
https://doi.org/10.1515/9783110757101-003 
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1 Der digitale Historiker als „randonneur“ 


Im Oktober 2019 fand im Deutschen Historischen Institut in Washington die Ta- 
gung ,,Digital Hermeneutics: From Research to Dissemination“ statt, welche das 
GHI in Zusammenarbeit mit dem Roy Rosenzweig Centre for History and New 
Media und dem Luxembourg Centre for Contemporary and Digital History orga- 
nisiert hatte.' In der Abschlussdiskussion, an der unter anderem Alan Liu, Tim 
Hitchcock und Jessica Owens zu resümierenden Kommentaren aufgefordert 
wurden, entspann sich eine interessante Diskussion darüber, wie sich die man- 
nigfaltigen methodologischen und epistemologischen Implikationen des Digita- 
len fiir die Geschichtswissenschaften beschreiben beziehungsweise fassen lie- 
ßen. Mit anderen Worten: What does the „D“ to history? In ihrer Direktheit und 
vordergriindigen Einfachheit verbirgt sich in dieser Frage eine Komplexitat, de- 
ren Vielschichtigkeit und Verästelungen mich bis heute umtreiben. Das, was in 
diesem Aufsatz präsentiert wird, spiegelt demnach einen zeit- und standortge- 
bundenen Einblick in einen Denkprozess wider, der sich durch vorsichtiges 
„heuristisches Tasten“ auszeichnet und sich der Serres’schen Analogie des 
„randonneurs“ verpflichtet fühlt. „Schlagen Sie sich seitwärts“ — „debrouillez- 
vous“, so lautet Serres’ Ratschlag in dem Kapitel „Methode und Wanderung“ in 
Die fünf Sinne. Eine Philosophie der Gemenge und Gemische. 

Sich dem Digitalen als großes „D“ anzunähern, fühlt sich in der Tat wie der 
von Serres beschriebene Exodus des Odysseus an: jenen Weg, der sich durch 
Abweichungen, Fluktuationen und Zerstreuungen kennzeichnet und nicht 
durch cartesianische Linearität. Die Semantik des Begriffs „randonnée“, der im 
französischen „courir a randon“ das Verfolgen des Wildes und das Spurenlesen 
meint, im Englischen aber als „random“ die Erinnerung an den unregelmäßi- 
gen, unvorhergesehenen Fluchtweg des Wildes behielt und damit auf die Zufäl- 
ligkeit der zurückgelegten Strecke verweist, bringt genau jenes Gefühl der Am- 
bivalenz zum Ausdruck, welches mich beim Versuch beschleicht, die multiplen 
Interferenzen des Digitalen in der Praxis historischen Arbeitens zu „erfassen“. 
Erfassen ist hier im Cassirer’schen Sinne als doppelter Akt des „Begreifens“ ge- 


1 Für einen Konferenzbericht siehe Tim van der Heijden, Juliane Tatarinow und Gerben Zaags- 
ma, „Transatlantic Perspectives on Digital Hermeneutics“, 05.11.2019, https://www.c2dh.uni. 
lu/de/thinkering/transatlantic-perspectives-digital-hermeneutics. Zugriff am 16.12.2021. 

2 Zum Begriff des „heuristischen Tastens“ als experimenteller Erkenntnismodus siehe Olaf 
Breidbach, Peter Heering, Matthias Müller und Heiko Weber (Hg.), Experimentelle Wissen- 
schaftsgeschichte (München: Brill, 2010), 13-72. 

3 Michel Serres, Die fünf Sinne. Eine Philosophie der Gemenge und Gemische (Frankfurt a. M.: 
Suhrkamp, 1998), 366. 
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meint: „Alle geistige Bewältigung der Wirklichkeit“, so Cassirer in seiner Schrift 
Form und Technik aus dem Jahr 1930, „ist an diesen doppelten Akt des ‚Fassens‘ 
gebunden: an das ‚Begreifen‘ der Wirklichkeit im sprachlich-theoretischen Den- 
ken und an ihr ‚Erfassen‘ durch das Medium des Wirkens; an die gedankliche 
wie an die technische Formgebung.“* 

Genau an dieser Schnittstelle zwischen Theorie und Praxis, konzeptioneller 
Durchdringung und methodologischer Reflektion von Geschichtswissenschaft 
im digitalen Zeitalter setzen meine Uberlegungen zu einer digitalen Hermeneu- 
tik der Geschichtswissenschaft an.’ Es ist dieses Spannungsfeld zwischen einer 
auf methodologischen Grundlagen des 19. Jahrhunderts beruhenden Disziplin 
und der sich radikal wandelnden Wissensökonomie des 21. Jahrhunderts, wel- 
ches zum Uberdenken und zur Anpassung zentraler Konzepte, Praxen und da- 
mit des Relevanz- und Wissenschaftsanspruches des Faches zwingt. Digitale 
Forschungsinfrastrukturen, Datenbestände und Werkzeuge beeinflussen heute 
die Art und Weise wie wir Geschichte denken (Fragestellungen und Forschungs- 
perspektiven), machen (Methoden und Interpretation) und erzählen (Argumen- 
tationen und narrative Formate); kurzum: wie wir historischen Sinn produzie- 
ren und versuchen, das Vergangene deutend zu verstehen. 

Als praktische Erkenntnistheorie der Geschichtswissenschaft interessiert 
sich digitale Hermeneutik also für die Spannung zwischen „Fremdheit“ und 
„Vertrautheit“ der historischen Überlieferung, diesem „Zwischen“, das laut 
Hans-Georg Gadamer der „wahre Ort der Hermeneutik“ ist. Wenn wir akzeptie- 
ren, dass Hybridität „the new normal“ ist,” brauchen wir ein Update der histori- 
schen Hermeneutik, um die methodologischen und epistemologischen Span- 
nungen in aktuellen Geschichtspraktiken explizit zu machen. Angewandte digi- 
tale Hermeneutik ist ebenso sehr „Theorie der Praxis“ wie „Praxis der Theorie“. 
Der konzeptionelle Rahmen der digitalen Hermeneutik lädt dazu ein, systema- 
tisch über die digitalen „Interferenzen“ im iterativen Prozess historischer Sinn- 
bildung nachzudenken. Das heißt konkret: 


4 Ernst Cassirer, „Form und Technik,“ in Ernst Cassirer, Symbol, Technik, Sprache. Aufsätze 
aus den Jahren 1927-1933 (Hamburg: Meiner, 1995), 52. 

5 Siehe hierzu Andreas Fickers, „Update für die Hermeneutik. Geschichtswissenschaft auf dem 
Weg zur digitalen Forensik?“ Zeithistorische Forschungen 17 (2020) 1: 157-168; Andreas Fickers 
und Juliane Tatarinow (Hg.), Digital Hermeneutics. Between Theory and Practice (Berlin: DeGru- 
yter, 2022), im Druck. 

6 Hans-Georg Gadamer, Wahrheit und Methode. Grundziige einer philosophischen Hermeneutik 
(Tübingen: Mohr Siebeck, 2010), 300. 

7 Gerben Zaagsma, „On Digital History,“ BMGN - Low Countries Historical Review, 128 (2013) 4: 
3-29. 
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- die Black Boxes von algorithmusgesteuerten Suchmaschinen zu öffnen und 
über die Heuristik der Suche in Online-Katalogen und Repositorien nachzu- 
denken;? 

- über die 6 V’s der Datenintegrität nachzudenken (volume, velocity, variety, 
validity, veracity, value) und uns in historischer Datenkritik zu schulen;? 

- zu verstehen, wie digitale Werkzeuge die epistemischen Objekte unserer 
Untersuchungen ko-konstruieren und Benutzer:innen zu Manipulator:in- 
nen hochspezifischer Forschungsinstrumente machen;' 

- den „look of certainty“! der Datenvisualisierung zu dekonstruieren, indem 
wir die indexikalische aber dynamische und relationale Beziehung zwi- 
schen „Backend“ und „Frontend“ von dynamischen Interfaces erforschen; 

- eine multimodale Kompetenz zu entwickeln, um die narrativen Konventio- 
nen des transmedialen Geschichtenerzählens und die relationale Logik von 
Web-Applikationen und Archiven zu entschlüsseln.'? 


Über die mannigfaltigen Herausforderungen eines „Updates“ der klassischen 
Hermeneutik im Bereich der historischen Quellen- und Werkzeuskritik finden 
sich in dem Blog des Doktorandenkollegs „Digital History & Hermeneutics“ 
zahlreiche reflexive Notizen und ,,Hands-on“-Erfahrungsberichte. An dieser 
Stelle möchte ich mich deshalb mit zwei anderen Dimensionen des Digitalen 
beschäftigen, welche einen vielleicht subtileren Einfluss auf die geschichtswis- 
senschaftliche Forschung haben, da sie eher geschichtsphilosophischer und er- 
kenntnistheoretischer Natur sind. Zum einen die Dimension des Symbolischen 
digitaler Werkzeuge und Infrastrukturen, also das, was Sheila Jasanoff und 
Sang-Hyun Kim als „sociotechnical imaginaries“ der „dreamscapes of moderni- 
ty“ bezeichnen;'* zum anderen die Dimension des Imaginären, das heißt den 


8 David Gugerli, Suchmaschinen. Die Welt als Datenbank (Frankfurt a.M.: Suhrkamp, 2009). 
9 Carl Lagoze, „Big Data, Data Integrity, and the Fracturing of the Controle Zone,“ Big Data & 
Society 1 (2014): 1-11. 

10 Marijn Koolen, Jasmijn van Gorp und Jacco van Ossenbruggen, „Toward a Model for Digital 
Tool Criticism: Reflection as Integrative Practice,“ Digital Scholarship in the Humanities 34 
(2019) 2: 368-385. 

11 Johanna Drucker, Visualization and Interpretation. Humanistic Approaches to Display (Cam- 
bridge, Massachusetts: MIT Press, 2020). 

12 Steve F. Anderson, Technologies of History. Visual Media and the Eccentricity of the Past 
(New Hampshire: Dartmouth College Press, 2011); Tracy Bowen und Carl Withaus (Hg.), Mul- 
timodal Literacies and Emerging Genres (Pittsburgh: University of Pittsburgh Press, 2013). 

13 Siehe Digital History & Hermeneutics, https://dhh.uni.lu/category/blog. 

14 Sheila Jasanoff und Sang-Hyun Kim, Dreamscapes of Modernity. Sociotechnical Imaginaries 
and the Fabrication of Power (Chicago: University of Chicago Press, 2015). 


What the D does to history —— 49 


Einfluss digitaler Quellenbestände, Archive und anderer Repräsentationen von 
Vergangenheit auf unsere historische Imagination und das, was Frank Ankers- 
mit als „sublime historische Erfahrung“ bezeichnet.” 


2 Mythos des Digitalen und neues Zeitregime? 


Nicht nur in der populärwissenschaftlichen Literatur ist die Ära der Digitalität 
eng mit dem Nimbus des Revolutionären und der disruptiven Kraft radikaler In- 
novationen verwoben. Wie zuvor bei allen neuen Massenmedien geschehen, 
wurde auch der Erwartungshorizont des Digitalen durch soziotechnische Imagi- 
nationen geprägt, die auf relativ stabilen Tropen modernistischer und futuristi- 
scher Sprach- und Bildfiguren basieren.'° In seinem Buch The Digital Sublime 
aus dem Jahre 2005 hat der Kommunikationswissenschaftler Vincent Mosco die 
mythologische Dimension der Cyberspace- und Internetnarrative dekonstruiert, 
und auf die subtile Anziehungskraft jenes Diskurses hingewiesen, der das digi- 
tale Zeitalter als radikal gesellschaftstransformierenden Einschnitt in der Ge- 
schichte der Menschheit konstruiert.” 

Auch in der Geschichtswissenschaft postulierte der Pionier der digitalen Ge- 
schichtswissenschaft Roy Rosenzweig im Jahre 2003 den Übergang von einem 
„age of scarcity“ in ein „age of abundance“, welches sich durch ein nie gekann- 
tes Angebot an online zugänglichen Zeugnissen aus der nahen und fernen Ver- 
gangenheit kennzeichnet.' Während sich der Topos der Informationsüberflu- 
tung wie ein roter Faden durch die Geschichte des Wissens zieht, hat das Inter- 
net und das World Wide Web in den Worten eines anderen Pioniers der 
digitalen Geschichtswissenschaften im deutschsprachigen Raum, Peter Haber, 
ein weiteres Phantasma wiederbelebt: das „Phantasma des universell verfügba- 
ren Wissens“, das er in seinem Buch „Digital Past“ als „Google Syndrom“ be- 
schrieben hat.!? Zehn Jahre nach Habers und Rosenzweigs Publikationen An- 
fang der 2000er Jahre wurden die Analogien von Wikipedia als Bibliothek Alex- 


15 Frank Ankersmit, Sublime Historical Experience (Stanford: Stanford University Press, 2005). 
16 Siehe beispielhaft Patrice Flichy, The Internet Imaginaire (Cambridge, Massachusetts: MIT 
Press, 2007). 

17 Vincent Mosco, The Digital Sublime. Myth, Power, and Cyberspace (Cambridge, Massachu- 
setts: MIT Press, 2004). 

18 Roy Rosenzweig, „Scarcity or Abundance? Preserving the Past in a Digital Era,“ The Ame- 
rican Historical Review 108/3 (2003): 735-762. 

19 Peter Haber, Digital Past. Geschichtswissenschaft im digitalen Zeitalter (München: Olden- 
bourg Verlag, 2011). 
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andriens unserer Zeit und der Wikipedianer als Diderots legitime Erben von der 
„big data“-Metapher überrollt, die sich in Windeseile zum neuen Mantra gesell- 
schafts- wie wissenschaftspolitischer Phantasien entwickelte.” Dies nur, um 
dann ihrerseits in den letzten zwei, drei Jahren von der x-ten Renaissance der 
Künstlichen Intelligenz als zentraler soziotechnischer Imagination überlagert 
zu werden. 

Die in diesen Diskursen zum Ausdruck kommenden Erwartungshorizonte 
ließen sich problemlos in die lange Dauer stabiler narrativer Muster von techni- 
schen Fortschrittserzählungen einbetten.” Doch dies ist nicht mein Anliegen. 
Vielmehr stelle ich mir die Frage, welche Vorstellungen von Zeit und histori- 
scher Imagination und Erfahrung in diesen Phantasmen, Metaphern und My- 
then zum Ausdruck kommen, und welche Bedeutung diese Vorstellungen oder 
Erwartungshaltungen für die geschichtswissenschaftliche Forschung haben 
könnten. Seit der sozialkonstruktivistischen Wende der Geistes- und Sozialwis- 
senschaften wissen wir, dass Diskurse keine passiven sprachlichen Abbildun- 
gen von Realität, sondern aktiver Teil der Gestaltung von Gesellschaft und Poli- 
tik, Wissenschaft und Technik sind. Sie beeinflussen die Art und Weise, wie wir 
über Geschichte denken. Meine Ausgangsfrage lässt sich also folgendermaßen 
reformulieren: Haben wir es beim Zeitalter der Digitalität mit einem neuen Zeit- 
regime zu tun, das unser Verhältnis zur Vergangenheit, Gegenwart und Zukunft 
auf andere, neue Weise strukturiert? 

„We’ve become victims of our ever-increasing capacity to store, organise, 
instantly access, and share vast amounts of cultural data,“ so Simon Reynolds 
in seinem Buch Retromania. „Not only has there never before been a society so 
obsessed with the cultural artifacts of its immediate past, but there has never 
before been a society that is able to access the immediate past so easily and so 
copiously.“ Der rapide technologische Wandel erzeugt laut Reynolds Gefühle 
der Nostalgie und habe neben der Vergangenheit auch die Gegenwart zum „for- 
eign country“ gemacht. Diese Feststellung deckt sich mit den Befunden von His- 
toriker:innen und Kulturwissenschaftler:innen wie Francois Hartog, Andreas 
Huyssen oder Aleida Assmann, die unserer Gegenwart ein kulturelles Zeitre- 


20 Siehe beispielhaft Viktor Mayer-Schönberger und Kenneth Cukier, Big Data: A Revolution 
That Will Transform How We Live, Work, and Think (London: John Murray, 2013). 
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gime attestieren, welches durch eine ausgedehnte, ja „gefräßige“ Gleichzeitig- 
keit gekennzeichnet ist „die alles in ihren Schlund zieht [...] und nicht nur die 
Differenz der Zeiten, sondern auch das historische Bewusstsein zerstört.“ „Un 
présent monstre“, so Hartog.” Gleichzeitig kennzeichnet sich dieser Päsentis- 
mus laut Aleida Assmann durch eine nie gekannte „Reaktualisierung der Ver- 
gangenheit“, einen neuen „Chronotopos“ aus, in dem sich die „Zugänge zur 
Vergangenheit vervielfältigt haben.“ 

Es überrascht, dass weder Assmann, Hartog noch Huyssen — zumindest 
nicht in systematischer oder argumentativ zwingender Weise - die digitale 
Wende als eine der möglichen Ursachen dieses neuen Zeitregimes anführen. 
Machen Assmann und Huyssen den „memory boom“ seit den 1980er Jahren als 
Hauptursache für das neue Zeitregime aus, verweist Hartog auf die Krise des 
modernen Zeitregimes, welches sich seit der Sattelzeit durch seine systemati- 
sche Zukunftsorientierung auszeichnete. Dagegen machen medienwissenschaft- 
liche Studien” sowie zahlreiche Autor:innen aus dem Feld der Digital Huma- 
nities die „digitale Revolution“ und den „big data turn“ für die „breite Gegen- 
wart“? verantwortlich. Die Kultur der Digitalität zeichnet sich aus dieser 
Perspektive durch eine sozio-technische Imagination aus, die von der Idee der 
Konnektivität bestimmt wird. Laut Andrew Hoskins, einem der führenden Au- 
tor:innen im Bereich der Digital Memory Studies, ermöglicht der „connective 
turn“ einen bislang ungekannten und privilegierten Zugang zur Vergangenheit: 
„Ihe networked self and society foster a view that collapses past and present 
into an orgy of hyperconnectivity: an impossible fantasy of prior generations 
with their now forgotten closed and contained media imaginaries.“?® 
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3 Hyperkonnektivität und digitales Vergessen 


Während Hoskins in der Hyperkonnektivität eine neue Erinnerungskultur in 
Echtzeit erkennt, deuten andere das digitale Zeitalter als Zeitregime, das sich 
durch massenhaftes Vergessen auszeichnet: „In the digital age, in what is 
perhaps the most fundamental change for humans since our humble begin- 
nings, that balance of remembering and forgetting has become inverted. Com- 
mitting information to digital memory has become the default, and forgetting 
the exception,“?? so Viktor Mayer-Schönberger in seinem Essay Delete. The Vir- 
tue of Forgetting in the Digital Age. Mayer-Schönberger macht hierfür eine simp- 
le Rechnung auf: Waren der Aufwand für die Speicherung und Inszenierung 
analoger Zeugnisse im Kontext einer antizipativen Erinnerungspraxis immens 
hoch, sind die Kosten für digitale Speicherung so dramatisch gesunken, dass es 
sich aus ökonomischer Hinsicht nicht mehr lohnt, Zeit in die Selektionsarbeit 
zu investieren.” Diese neue Form des digitalen Vergessens bezeichnet Aleida 
Assmann als ,,Verwahrensvergessen“*!: Wir speichern Tausende von digitalen 
Photos, Videos und E-Mails auf unseren Smartphones oder Laptops in der nai- 
ven Hoffnung, sie irgendwann einmal wieder hervorzukramen! 

Noch pertinenter ist die Frage des digitalen Vergessens beim Leitmedium 
des digitalen Zeitalters: dem Internet. Entgegen der weit verbreiteten Auffas- 
sung, das Internet vergesse nichts, warnte bereits die UNESCO in ihrer 2003 ver- 
öffentlichten Charter on the Preservation of Digital Heritage vor einem zukünfti- 
gen „digital dark age“”. Studien zur Halbwertszeit von Hyperlinks im Internet 
zeigen, dass von 100 Links nach zwei Jahren nur noch 50% funktionieren. Zu 
diesem als „link rot“ bezeichneten Phänomen gesellt sich die Tatsache, dass die 
durchschnittliche Lebensdauer einer Webseite nur acht Monate beträgt. Durch 
den exponentiellen Anstieg neuer Datenmengen wird die dem dynamischen 
Charakter des Netzes eingeschriebene Instabilität kaschiert. Dieser ephemere 
Charakter des Word Wide Web stellt zukünftige Historiker:innengenerationen 
vor enorme methodologische Herausforderungen. Das Internet wird bisher nur 
extrem lückenhaft archiviert, und selbst dort, wo nationale oder private Initiati- 
ven existieren, haben wir es mit speziellen digitalen Konglomeraten zu tun, die 
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Niels Briigger als ,,reborn digital medium“ beschreibt.*? Das World Wide Web ist 
ein Medium, welches sichtbare und unsichtbare Textebenen, Hyperlinks und 
fragmentierte Informationseinheiten in einer komplexen Netzwerkstruktur mit- 
einander verbindet. Diese dynamische und relationale Architektur ist dafiir ver- 
antwortlich, dass wir es beim Wiederaufrufen archivierter Webpages mit ,,digi- 
talen Wiedergeburten“ zu tun haben, deren informationstechnische, inhaltliche 
wie darstellerische Integrität auf multiple Weise korrumpiert sind. Eine archi- 
vierte und „wiedergeborene“ Webpage ist immer das Resultat einer doppelten 
Transformation: Sowohl die Archivierung (etwa durch die Benutzung von 
„Webcrawling Software“**) als auch die Wiederaktivierung (zum Beispiel durch 
die „Wayback Machine“) greifen aktiv in die semantische Ordnung und visu- 
elle Repräsentation der relationalen Datenbestände ein und machen so klassi- 
sche Prinzipien der Archivwissenschaft wie „respect des fonds“ und „respect de 
Pordre“ obsolet.?° 

Es geht mir an dieser Stelle aber nicht um das Problem der historischen Da- 
tenintegrität von Webseiten, sondern um die dem Web eingeschriebene doppel- 
te Temporalität als „passive storage“ und „active memory“-Medium. Während 
Historiker:innen beim Besuch klassischer Archive nicht verändernd in die Orga- 
nisation und Logik des „Systems“ eingreifen, werden Nutzer:innen der „Way- 
back Machine“ zu Ko-Konstrukteur:innen eines neuen epistemischen Objekts, 
da es die „wiederbelebte“ Webseite so in der Vergangenheit nie gab. Wendy 
Chun, Professorin für Neue Medien an der Simon Fraser University in Vancou- 
ver/Canada spricht deshalb vom World Wide Web als „enduring ephemeral [...] 
creating unforeseen degenerative links between humans and machines.“” An- 
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ders als die auch anderen Quellengattungen innewohnende Spannung zwi- 
schen „evidence“ und „erasure“ — man denke hier beispielsweise an Photogra- 
phien oder Tonbandaufzeichnungen, haben wir es bei Digitalisaten und beson- 
ders dem World Wide Web mit einer Gleichzeitigkeit des Ungleichzeitigen zu 
tun, dessen Zeitlichkeit sich mit den Worten der brasilianischen Historiker Ma- 
teus Pereira und Valdei Araujo als „updatism“ beschrieben ließe: „a specific 
temporalization of time that connects the past with the present and the fu- 
ture.“ Entgegen der pessimistischen Note, welche in Hartogs Konzept des Prä- 
sentismus mitschwingt und in dem der Sieg der Gedächtnispolitik über die Ge- 
schichte bedauert wird, oder Gumbrechts Idee der „breiten Gegenwart“, in der 
das definitive Ende des Prozesses der Moderne beklagt wird, bedeutet „up- 
datism“ den kontinuierlichen Akt der Reaktualisierung vergangener, gegenwär- 
tiger wie zukünftiger Zeitbezüge in „Echtzeit“. Und dies eben nicht als individu- 
ellen Akt historischer Vergegenwärtigung, sondern als Resultat eines kollekti- 
ven und vernetzten Prozesses medialer Teilhabe und Partizipation. 


4 Dynamische Datenvisualisierungen und 
Hermeneutik des Dazwischenseins 


Doch bedeutet diese digitale Verfügbarkeit, dass sich mit dem mobilen Zuhan- 
densein von Vergangenem auf Tablets und Smartphones auch die historische 
Erfahrung und Imagination verändern? Durchaus! Hierzu zwei Beispiele. Wie 
Claudio Fogu, Wulf Kansteiner und Todd Presner am Beispiel der Erinnerung 
an den Holocaust gezeigt haben, stellt die virtuelle Inszenierung von Zeitzeugen 
im Visual History Archive der Shoah Foundation eine ästhetische und morali- 
sche Herausforderung für die Geschichtspädagogik wie Gedächtnispolitik dar, 
da sie direkt auf die Wahrnehmung und Erfahrung von authentischen Zeugen- 
aussagen oder Orten - etwa während eines Besuches des Konzentrationslagers 
Auschwitz-Birkenau - einwirken können. Die ,,Selfie-Debatte““° von 2014 hat 


38 Mateus H.F. Pereira und Valdei Araujo, „Updatism: Gumbrecht’s broad present, Hartog’s 
Presentism and beyond“ Diacronie. Studi di Storia Contemporanea: Miraggi e realtä: spazi e 
tempi della storia, 43 (2020) 3. http://www.studistorici.com/2020/10/29/pereira-araujo_nume 
ro_43/. Zugriff am 16.12.2021. 

39 Claudio Fogu, Wulf Kansteiner und Todd Presner (Hg.), Probing the Ethics of Holocaust 
Culture (Harvard: Harvard University Press, 2016). 

40 Im Juni 2014 hatte die 18-jährige US-Amerikanerin Breanna Mitchel ein Selfie von ihrem 
Besuch in Auschwitz-Birkenau gepostet, was international für Entrüstung gesorgt hatte. Zu 
dieser Debatte siehe Maria Zalewska, „Selfies from Auschwitz: Rethinking the Relationship Bet- 
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die komplexe Uberlagerung von institutionalisierter Gedenkkultur und digitaler 
Medienpraxis beispielhaft zum Vorschein gebracht: Authentisches Erleben vor 
Ort und synchrones Teilen der eigenen ,,dark tourism“-Erfahrungen in sozialen 
Medien verschmelzen in der digitalen Erinnerungskultur zu einem historischen 
Erlebnis. Erfolgreiche Inszenierung des Authentischen erfordere im digitalen 
Zeitalter geradezu den Einsatz digitaler Medien, so Kansteiner.”! 

Am Beispiel der Erinnerung an den Ersten Weltkrieg auf Twitter (zum 100- 
jährigen Gedenken) hat Frederic Clavert gezeigt, dass die Zirkulation von Nach- 
richten in den sozialen Medien ein eigenes Zeitregime bilden, das sich radikal 
von der „longue durée“ des kulturellen Gedächtnisses unterscheidet, welches 
die Erinnerung an den Ersten Weltkrieg prägt.“ Auf Basis der Analyse von über 
drei Millionen Tweets, die er zwischen dem 1. April 2014 und dem 22. November 
2016 auf Basis von deutschen, französischen und englischen Hashtags in einer 
Datenbank archiviert hat, stellt Clavert die Hypothese auf, dass das Erinnern im 
Hochfrequenztakt der sozialen Medien eine neue Qualität kommunikativer Ge- 
dächtnisbildung bedeutet, die sich durch verteilte Autorität und einen kollekti- 
ven Bezug zu den Spuren der Vergangenheit auszeichnet. 

Akzeptiert man den von Andreas Hepp postulierten kommunikationswis- 
senschaftlichen Befund der „deep mediatization“ der besagt, dass sich unsere 
Gegenwart durch Rhythmussteigerung und erhöhtes Tempo der Ko-Konstrukti- 
on medialer Realität auszeichnet, so scheint es folgerichtig, dass auch unsere 
Erfahrung und Imagination der Vergangenheit — die im Wesentlichen medial 
vermittelt sind - von dieser Entwicklung betroffen sind. War die Geschichts- 
kultur des 19. Jahrhunderts durch „sinnliche Anmutungskraft“** historischer 
Romane oder Nationalmuseen, die des 20. Jahrhunderts durch die auratische 
Wirkung von Ton- und Bildaufzeichnungen geprägt,” so regen im digitalen 


ween Spaces of Memory and Places of Commemoration in the Digital Age,“ Studies in Russian, 
Eurasian and Central European New Media 18 (2017): 95-116. 

41 Wulf Kansteiner, „The Holocaust in the 21st Century: Digital Anxiety, Transnational Cos- 
moplitanism, and Never Again Genocide Without Memory,“ in Digital Memory Studies: Media 
Pasts in Transition, hg. v. Andrew Hopkins (London: Routledge, 2018), 110-140. 

42 Frédéric Clavert, „Face au passé: la Grande Guerre sur Twitter,“ Le Temps des médias 31/2 
(2018): 173-186. 

43 Andreas Hepp, Deep Mediatization (London: Routledge, 2019). 

44 Martin Sabrow und Achim Saupe, „Historische Authentizität. Zur Kartierung eines For- 
schungsfeldes,“ in Historische Authentizität, hg. v. Martin Sabrow und Achim Saupe (Göttin- 
gen: Wallstein, 2016), 14. 

45 Andreas Fickers, „Entre vérité et dire du vrai: Ein geschichtstheoretischer Grenzgang,“ Jeux 
sans Frontières? — Grenzgänge der Geschichtswissenschaft, hg. v. Andreas Fickers, Rüdiger Hau- 
de, Stefan Krebs und Werner Tschacher (Bielefeld: transcript: 2018), 29-40. 
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Zeitalter dynamische historische Netzwerkvisualisierungen, animierte „deep 
mapping“-Technologien und interaktive multilineare Zeitachsen in virtuellen 
Ausstellungen die Phantasie und historische Imagination an. 

Interaktive Interfaces und relationale Datenbanken, gefüllt mit Tausenden 
oder Millionen Quellen aus unterschiedlichen Genres, erzeugen einen neuen 
historischen Sinn, der sich laut Alan Liu der Ideologie der Linearität von histori- 
schem Denken verweigert. 


We might say that the essential hermeneutic — or what we might today call algorithm - of 
Historismus was to interpret all the spatial (and political) barriers that impeded full-on hu- 
man sociality as temporal delay. Civilization was the delayed action of sociality unfolding 
in historical time. [...] The temporality of shared culture is thus no longer experienced as 
unfolding narration but instead as ‘real time’ media.*® 


Dynamische Visualisierungen der komplexen Beziehung von historischen Pro- 
zessen und Freignissen erzeugen ein neues historisches Wissen, welches Liu als 
„hypergraphical knowledge“ bezeichnet: 


The digital age promotes hypergraphical models of knowledge that conform to a world 
view in which knowledge is conceived by default to be multiperspectival and multiscalar, 
distributed in its foci and relations, and (connecting all the disparate nodes and levels) 
ultimately networked.”’ 


Wie Liu beschreibt auch der amerikanische Medientheoretiker Lev Manovich 
die digitalen Datenvisualisierungen kultureller Artefakte und Sammlungen als 
„neue Sprache“, die wir erlernen müssen, wenn wir in Zukunft „Sinn“ aus den 
„big data of the past“ generieren möchten. Denn bislang überlassen wir diese 
Sinnbildung - die sich meist auf die Sichtbarmachung von Mustern reduziert, 
die auf Basis statistischer Modellbildung erzeugt werden — den Computer- und 
Datenwissenschaftler:innen, deren epistemische Kultur sich deutlich von der 
hermeneutischen Tradition der Geisteswissenschaften unterscheidet. Zwar tei- 
len sich beide Wissenschaftskulturen nun oftmals dieselben digitalen Werkzeu- 
ge und computer- bzw. softwarebasierten Methoden, aber die Problemstellun- 
gen und Untersuchungsobjekte divergieren erheblich: 


Thus, we have two research universes that often use the same computational methods, 
but apply them to different ‘cultures’. On the humanities side, we have the past that 
stretches into hundreds or even thousands of years. On the computer science side, we 


46 Alan Liu, Friending the Past. The Sense of History in the Digital Age (Chicago: Chicago Uni- 
versity Press, 2018), 19-20. 
47 Ibid., 73. 
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have the present that starts in the beginning of the 21° century. On the humanities side, 
we have artifacts created by professional elites. On the computer science side, we have 
artifacts and online behavior by everybody else.48 


Sind die meisten sozio-kulturellen Daten, welche anhand algorithmusbasierter 
machine-learning Methoden in den Computerwissenschaften analysiert werden, 
sogenannte „digital born“-Quellen (häufig Daten aus Sozialen Medien), haben 
wir es bei historischen Datenbeständen meist mit wesentlich kleineren Daten- 
mengen zu tun, die sich generell durch größere Komplexität und Diversität aus- 
zeichnen. 

Die meisten Werkzeuge, die in den digitalen Geschichtswissenschaften im 
Bereich des Text Mining zum Einsatz kommen - etwa zur Eigennamenerken- 
nung oder Themenanalyse - sind darauf programmiert, Muster zu erkennen 
oder Haufigkeitsverteilungen zu berechnen, nicht aber Abweichungen und Par- 
tikularitäten zu identifizieren, die uns als Historiker:innen meist mehr interes- 
sieren als statistische Mittelwerte.‘? Diese Spannung zwischen der maschinen- 
betriebenen Suche nach Mustern und Trends und der problem- und frageorien- 
tierten Suche nach dem historisch Speziellen und Partikularen erfordert auch 
methodologisch eine Hermeneutik des Dazwischenseins, die Stephen Ramsey 
als „hermeneutics of screwing around“ beschrieben hat: 


Trying to locate a hermeneutics at the boundary between mechanism and theory [...]. Al- 
gorithmic criticism proposes that we channel the heightened objectivity made possible by 
the machine into the cultivation of those heightened subjectivities necessary for critical 
work.! 


Die Erkenntnis, dass „Daten“ in den Geisteswissenschaften komplex, unscharf 
und unvollständig sind, ist Allgemeingut. Es überrascht daher, dass viele For- 
schungsprojekte auch in den digitalen Geschichtswissenschaften sich auf rela- 
tiv simple Fragestellungen reduzieren — etwa der Suche beziehungsweise Iden- 
tifikation von sogenannten „named entities“ wie Personen-, Orts- und Zeitanga- 
ben. Fragen nach dem Wo, Wer und Wann könnte man boshaft als kleines 
Einmaleins der historischen Arbeit bezeichnen. Fragen nach dem Wie, Warum 


48 Lev Manovich, Cultural Analytics (Cambridge, Massachusetts: MIT Press, 2019), 46. 

49 Andreas Fickers, „Veins Filled with the Diluted Sap of Rationality: A Critical Reply to Jens 
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oder Wozu lassen sich mit den meisten digitalen Werkzeugen bis heute kaum 
beantworten. Viele textbasierte Projekte der ersten und zweiten Welle der Digi- 
tal Humanities zeichnen sich durch eine eher positivistische Herangehensweise 
aus, was der Logik der Instrumente und Werkzeuge geschuldet war, mit denen 
die digitalen Korpora ,,befragt“ wurden. Das erkenntnistheoretische Potenzial 
solcher Arbeiten steigt meines Erachtens erheblich mit der Uberwindung statis- 
tischer Modellbildung in Richtung frage- und problemgesteuerter Simulationen. 
Erst wenn die auf Mustererkennung und Häufigkeitsverteilungen spezialisierten 
Algorithmen zu dynamischen Simulationen historischen Wandels weiterentwi- 
ckelt werden können, werden die digitalen Geschichtswissenschaften neue Im- 
pulse zur Theoriebildung komplexer historischer Prozesse beitragen. 

Es war der überwiegend a-historische Ansatz der positivistischen und empi- 
ristischen Forschung im 19. Jahrhundert, der Wilhelm Dilthey dazu angespornt 
hat, seine hermeneutische Theorie der Geisteswissenschaften zu formulieren. 
Ein historisches Verständnis der Vergangenheit fußt laut Dilthey notwendiger- 
weise auf der Erkenntnis der grundsätzlichen Geschichtlichkeit sowohl vergan- 
gener als auch gegenwärtiger Tatsachen und Wirkungen. Ohne die Möglichkeit 
struktureller Kausalitäten zu leugnen, betonte Dilthey die Individualität der 
Wahrnehmung, der Vorstellung und des Denkens, die nötig sei, um einen kriti- 
schen Zugang zur Geschichte zu entwickeln und sowohl strukturelle Kräfte als 
auch individuelles Handeln deutend verstehen zu können. Übertragen auf die 
digitalen Geschichtswissenschaften heißt dies in meinen Augen, dass erst die 
Kombination von maschinenbasierten Methoden des distant reading mit der 
hermeneutischen Methode des close reading dazu führen wird, generische Phä- 
nomene mit partikularen Erscheinungen in Verbindung zu setzen, und so statis- 
tische Beobachtungen und Korrelationen auf ihre historische Relevanz überprü- 
fen zu können. Diese Fähigkeit des „scaleable reading“, des Ein- und Auszoo- 
mens vom Allgemeinen zum Spezifischen - also die Kombination der 
explorativen und interpretativen Analyse von Datenbeständen - ist eine neue 
Episode der Kulturtechnik des Lesens, die uns augenblicklich noch fremd ist.” 
Es wird wohl eine Generation dauern, bis diese neue Form des skalenbasierten 
Lesens uns so vertraut ist, wie uns heute das Lesen am Bildschirm oder das ver- 
tikale Scrollen am Smartphone ist. Wie schon bei Dilthey gilt es, uns dem Frem- 
den im hermeneutischen Prozess des Dazwischenseins anzunähern: 


Die Auslegung wäre unmöglich, wenn die Lebensäußerungen gänzlich fremd wären. Sie 
wäre unnötig, wenn in ihnen nichts fremd wäre. Zwischen diesen beiden äußersten Ge- 


52 Gerhard Lauer, Lesen im digitalen Zeitalter (Darmstadt: wbg Academic, 2020). 
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gensätzen liegt sie also. Sie wird überall erfordert, wo etwas fremd ist, das die Kunst des 
Verstehens zu eigen machen soll, 


so Dilthey in seiner Vorlesung zum Aufbau der geschichtlichen Welt in den Geis- 
teswissenschaften aus dem Jahre 1910.” 


5 Die Aura des Digitalen und deren Entzauberung 


Wenn wir uns als Historiker:innen heute also computerbasierten Analysen und 
Interpretationen der Vergangenheit nähern, vollziehen wir genau jene herme- 
neutische Bewegung, die schon immer die Arbeit des fragend-forschenden Ge- 
schichtswissenschaftlers war: Wir wenden das von Carlo Ginzburg beschriebene 
diagnostische Verfahren der Spurensuche an und erzeugen gleichzeitig histori- 
schen Sinn durch die Produktion einer graphischen Erzählung - nunmehr im 
digitalen Raum „retrospektiver Wahrsagung“”“. Dass uns die informationstech- 
nischen und datenbankstrukturellen Hintergründe (oder das „Backend“) sol- 
cher digitalen Inszenierungen von historischem Sinn oftmals verborgen blei- 
ben, macht im Benjaminschen Sinne vielleicht gerade deren Aura aus: 


Die Spur ist Erscheinung einer Nähe, so fern das sein mag, was sie hinterließ. Die Aura ist 
Erscheinung einer Ferne, so nah das sein mag, was sie hervorruft. In der Spur werden wir 
der Sache habhaft; in der Aura bemächtigt sie sich unser.” 


Auch wenn wohl nicht alle Historiker:innen von der Aura digitaler Repräsenta- 
tionen und Visualisierungen gleichermaßen erfasst sein dürften, bin ich davon 
überzeugt, dass es für zukünftige Generationen von Historiker:innen von ent- 
scheidender Bedeutung sein wird, sich kritisch mit den Werkzeugen und Metho- 
den der digitalen Datenanalyse und den Möglichkeiten datenbasierter Zeit- und 
Raumvisualisierungen auseinanderzusetzen. Sich als Historiker:innen in inter- 
disziplinären und kollaborativen Projekten auf die Auseinandersetzung mit Me- 
thoden und Konzepten der Datenwissenschaften einzulassen, bedeutet nicht 
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nur klassische Kompetenzen wie die Quellenkritik oder Diskursanalyse auf digi- 
tale Daten und Korpora zu tibertragen und den Spezifika digitaler Medien anzu- 
passen, sondern auch einen Wissens- und Kompetenztransfer in Richtung der 
technischen Disziplinen. „If content is king, context is its crown“ - so brachte 
der schwedische Medienhistoriker Pelle Snickars die Bedeutung der hermeneu- 
tischen Methode für die Digital Humanities vor einigen Jahren auf den Punkt.’® 

Genau diese Kontextualisierung von großen Datenmengen wird in interdis- 
ziplinären Forschungsfeldern wie der Klima- und Umweltforschung als die zen- 
trale Herausforderung für die Zukunft gesehen - und beschäftigt auch For- 
schende der Geschichte, Archäologie und Anthropologie, die sich der Vergan- 
genheit mit dem Konzept der „deep history“ annähern.?’ Wie aussagekräftig 
komplexe Modelle und Simulationen über vergangene Realitäten und zukünfti- 
ge Szenarien sein werden, wird eben nicht nur von der Menge der vorhandenen 
Daten abhängen, sondern von deren Kontextualisierung und kritischen Analyse 
und Interpretation. „Big data is the answer... But what is the question?“ - frag- 
ten 2017 die beiden Wissenschafts- und Technikhistoriker Bruno Strasser und 
Paul Edwards in einem Artikel der Zeitschrift Osiris.” Als kritische Wissen- 
schaft, die frage- und problemgesteuert ist, kann die Geschichtswissenschaft 
hier einen wichtigen Beitrag für eine Wissensökonomie des 21. Jahrhunderts 
leisten, was — auf dezidiert provokative Weise — 2014 von Jo Guldi und David 
Armitage in der Streitschrift The History Manifesto eingefordert wurde.” Es geht 
also nicht nur darum zu begreifen, „what the D does to history“, sondern auch 
danach zu fragen, „what history does to D“. 
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Die Maschine und die Geschichts- 
wissenschaft 


Der Einfluss von deep learning auf eine Disziplin 


Abstract: Deep learning is a method from the field of artificial intelligence that 
is currently being used in many disciplines to create appraisal decisions. The 
form of machine learning is also being used in history, for example for text 
recognition or the identification of named entities. Since deep learning will be- 
come a much stronger part of the methodological apparatus in the future, it is 
worth taking a critical look at what is happening. The moment of training plays 
a crucial role within the method. There, models are created and optimized. 
Based on the provided data, patterns can be recognized and imitated. Signifi- 
cantly, the created models are only verifiable in retrospect and with test proce- 
dures and are at most partially comprehensible. Thus, hermeneutic approaches 
are needed to understand and classify the models. Accordingly, the use of deep 
learning in history will entail a new reflection on methods, which must take 
into account technical circumstances on the one hand and disciplinary specifi- 
cations on the other. 


Keywords: maschine learning, model training, corpus, text recognition, named 
entity recognition, text analysis 


Zusammenfassung: Deep learning ist ein Verfahren aus dem Bereich der kiinst- 
lichen Intelligenz, das aktuell in vielen Disziplinen zur Erstellung von Bewer- 
tungsentscheiden genutzt wird. Auch in der Geschichtswissenschaft wird die 
Form des maschinellen Lernens bereits genutzt, etwa zur Texterkennung oder 
der Identifikation von benannten Entitäten. Da deep learning zukünftig noch 
viel stärker Teil des Methodenapparats werden wird, lohnt sich ein kritischer 
Blick auf die Vorgänge. Das Moment des Trainings spielt in der Methode eine 
entscheidende Rolle. Dort werden Modelle erstellt und optimiert. Aufgrund der 
vorgesetzten Daten können Muster erkannt und imitiert werden. Bezeichnen- 
derweise sind die erstellten Modelle nur im Nachhinein und mit Testverfahren 
überprüfbar und höchstens bedingt nachvollziehbar. Damit braucht es herme- 
neutische Herangehensweisen, um die Modelle zu verstehen und einzuordnen. 
Die Nutzung von deep learning in der Geschichtswissenschaft wird entspre- 
chend eine neue Methodenreflexion nach sich ziehen, die einerseits technische 


3 Open Access. © 2022 Tobias Hodel, published by De Gruyter. [EX] Dieses Werk ist lizensiert unter 
einer Creative Commons Namensnennung 4.0 International Lizenz. 
https://doi.org/10.1515/9783110757101-004 
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Gegebenheiten und andererseits fachimmanente Spezifikationen beriicksichti- 
gen muss. 


Schlagwörter: Maschinelles Lernen, Modelltraining, Korpus, Texterkennung, 
Named Entity Recognition, Textanalyse 


Die Vision einer kiinstlichen Intelligenz (englisch artificial intelligence oder kurz 
AI) begleitet die Computerwissenschaft seit ihrem Entstehen. Seit wenigen Jah- 
ren fokussieren die Forschungen in diesem Bereich auf deep learning. Das Ver- 
fahren aus dem Bereich des maschinellen Lernens wird mittlerweile für zahlrei- 
che Bewertungsentscheide eingesetzt, die vor wenigen Jahren noch als ungeeig- 
net für die Bearbeitung durch Algorithmen oder allgemein „den Computer“ 
beurteilt wurden: Beispiele umfassen die Identifikation von Stimmen, selbstfah- 
rende Autos und die Einschätzung der Rückfallgefahr bei Verurteilungen von 
Straftäter:innen. 

Das Prinzip des deep learning ist an sich simpel: Neuronale Netze, dem 
menschlichen Gehirn nachempfundene vernetzte Speicherzellen, werden mit 
möglichst vielen Daten versorgt und in einem Trainingsprozess auf typischer- 
weise eine zu lösende Aufgabe getrimmt. Von Spracherkennung über Bildana- 
lyse zu Dokumentenauswertung - deep learning setzt sich als Technologie in 
unterschiedlichen Feldern durch. Sie wird insbesondere seit wenigen Jahren für 
naturwissenschaftliche Auswertungen benutzt, hält als Technologie entspre- 
chend bereits Einzug in wissenschaftliche Disziplinen. Die Nutzung der Techno- 
logie ist aber nicht unproblematisch und in dem Kontext auftretende Probleme 
stehen im Zentrum dieser Seiten.' 

In den Geisteswissenschaften wird die Technologie aktuell erst in Ansätzen 
genutzt. Die Texterkennung von Drucken und Handschriften ist einer der Ein- 
satzbereiche, die sich diesen Ansatz zu Nutze macht. Dies ist jedoch erst der An- 
fang, denn es ist absehbar, dass in naher Zukunft weit mehr (Be-)Wertungsent- 
scheide manuell unterstützt oder gar autonom getroffen werden, die Beschäfti- 
gung mit der Methode ist entsprechend wichtig. Named Entity Recognition, aber 
auch visuelle und textuelle Strukturanalysen zeigen gemäß ersten Tests und 
proof-of-concepts bessere Resultate, als dies rein regelgeleitete Algorithmen ver- 


1 Der Aufsatz ist der Versuch einen technologischen Ansatz zu vermitteln und gleichzeitig zu 
problematisieren. Die angesprochenen Themen werden entsprechend nicht in aller (notwendi- 
ger) Tiefe diskutiert, sondern vielmehr angeschnitten. Der Autor dankt für die angeregte Dis- 
kussion mit vielen Anknüpfungspunkten an der virtuellen Tagung sowie Christa Schneider und 
David Schoch für Diskussionen und kritischen Kommentare bei der Erstellung des Textes. 
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mögen. Mit wenig Phantasie lassen sich gar die Einsatzméglichkeiten noch er- 
weitern und die Interpretation von Texten mit und dank machine learning mo- 
dellieren. 

Im Rahmen dieses Papers werden drei Themenblöcke angeschnitten, die 
unterschiedliche Anwendungen des maschinellen Lernens im Fokus haben. Ers- 
tens, und wohl am unproblematischsten, ist die Nutzung von deep learning zur 
Handschriftenerkennung. Problematischer ist zweitens, die Entitätenerkennung 
(Named Entity Recognition), die kulturwissenschaftliche Fragen zu Praktiken 
der Namensgebung und zum Individuum im Generellen aufwirft. Drittens kann 
schließlich mit machine learning Ansätzen Strukturerkennung betrieben wer- 
den - dies ist eine Vorgehensweise, die in analoger Form etwa aus der Urkun- 
denlehre bereits bekannt ist. Um die Technologie in den Fokus zu stellen, ist es 
jedoch nötig, dass die drei Ansätze innerhalb des Arbeitens mit neuronalen Net- 
zen verortet und vor allem die Resultate kritisch betrachtet werden. Dieses Pa- 
per orientiert sich daher an den drei Perspektiven Training von neuronalen Net- 
zen, Interpretation von Input und Output, sowie Konsequenzen des Einsatzes 
maschineller Lernverfahren. 


1 Trainieren: Die Induktion von bias 


Training als Basis zur komplexen, statistisch unterstützten Wertung erweist 
sich als größte Stärke und gleichzeitig neuralgische Stelle der Aufbereitung von 
Quellenmaterial als Daten, da durch das Trainingsmaterial (Vor-)Urteile über- 
nommen und verstärkt werden. Diese Effekte wurden etwa für Suchmaschinen 
oder bei Bewerbungsprozessen mehrfach nachgewiesen und problematisiert.? 
Je nach Form des maschinellen Lernens werden Trainingsmaterialien zum Erler- 
nen, etwa von Annotationen, vorgegeben und überprüft (supervised learning) 
oder die Strukturen werden selbständig erlernt (unsupervised learning). 

Im Rahmen der Handschriftenerkennung werden Bildausschnitte einem zu 
erkennenden Text gegenübergestellt. Die Aufgabe des neuronalen Netzes ist es, 
eine Entsprechung zwischen Anhäufungen von Pixeln und zu erkennenden Zei- 
chen zu finden. Dabei agieren die meisten Systeme unabhängig vom Vorwissen 
und trainieren jeweils eigenständige Modelle. Damit gibt es keine natürliche 


2 Safiya Umoja Noble, Algorithms of Oppression: How Search Engines Reinforce Racism (New 
York 2018); Aylin Caliskan, Bryson, Joanna J. und Arvind Narayanan, „Semantics derived auto- 
matically from language corpora contain human-like biases,“ Science 356 (6334), 183-186, doi: 
10.1126/science.aal4230. 
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Verbindung zwischen Zeichen und Bild, es hängt vielmehr von den Vorgaben 
ab, die im Rahmen des Trainings gemacht werden. Die Distinktion von Zeichen 
liegt bei der trainierenden Person und auch im Umgang mit einem Zeichen in 
den vorhandenen Trainingsdaten. Der menschliche bias fließt zwar durch Tran- 
skriptionsentscheide in die Automatisierung ein, führt aber zu verhältnismäßig 
harmlosen Fehlern und Hyperkorrekturen. 

Analog dazu verhält es sich bei der Erkennung von benannten Entitäten, 
einem Problem, das ebenfalls mit supervised Ansätzen bearbeitet wird und ei- 
nen Algorithmus zur Nachahmung verleiten soll. Das System versucht tokens 
(„Wörter“ im Satzkontext) als einer Einheit (Person, Ort, Organisation etc.) zu- 
gehörig zu bestimmen. Im Vergleich zur Erkennung von handschriftlichem Text 
basiert bei der Named Entity Recognition ein zentraler Schritt auf der Anwen- 
dung von Sprachmodellen. Solche Modelle können große Textmengen in hoch- 
dimensionalen Vektorräumen verorten und damit Ähnlichkeiten zwischen Wör- 
tern aufzeigen, weil diese entweder häufig im selben Kontext auftauchen, syn- 
onym verwendet werden oder aus ähnlichen Zeichenfolgen bestehen. Beim 
Training der Entitätenerkennung wird einem System also entsprechend vermit- 
telt, inwiefern Wörter im Umfeld eines Vektors zu einer gemeinsamen Gruppe 
gehören. Zudem sehen wir, wie die Aufbereitung von Trainingsmaterial zur Ein- 
speisung von (Vor-)Urteilen führt, indem etwas als Person oder Ort verstanden 
wird. Als zusätzliches Problem stehen wir vor der Herausforderung, dass Spra- 
che nicht statisch ist, was die Erzeugung von historischen oder domänenspe- 
zifischen Sprachmodellen erforderlich macht. Diese Modelle sind natürlich auf- 
grund ihrer Basis auch gefärbt (dafür möchte ich den Begriff der „Kor- 
pusfärbung“ beliebt machen)? und bilden Sprache nur entsprechend dem 
zugrundeliegenden Korpus ab. 

Insgesamt bewegen wir uns folglich in einem Bewertungszyklus, der einer- 
seits als Arbeitserleichterung verstanden, aber gleichzeitig zum Verstärkungs- 
mechanismus von (Vor-)Urteilen (bias) wird. Der cycle of bias (siehe Abbildung 
1) entsteht dabei aus arbeitstechnisch sinnvollen und pragmatischen Abläufen, 
wobei Material aufbereitet (transkribiert/annotiert) und darauf aufbauend ma- 
chine learning basierte Modelle trainiert werden. Auf der Grundlage dieser Mo- 
delle wird weiteres Material miteinbezogen. Dadurch erhalten implizite und ex- 
plizite Vorstellungen eine Verstärkung. Wertungsentscheide wie, „was wird wie 
transkribiert“ oder „was ist ein Name“ verfestigen sich als Muster. Anhand der 


3 Unter Korpusfärbung verstehe ich die thematische und sprachliche Ausrichtung, die durch 
ein Korpus eingeführt wird und Modelle, die auf maschinellen Lernverfahren basieren, da- 
durch nicht nur beeinflussen, sondern geradezu definieren. Das Korpus wird dadurch mitver- 
antwortlich für die Bewertungen, die durch ein damit trainiertes Modell erstellt werden. 
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häufig manuellen Aufbereitung des Materials lassen sich immerhin noch Bevor- 
zugungen identifizieren. Noch problematischer ist indes, wenn bereits vorlie- 
gende Modelle beziehungsweise neuronale Netze direkt übernommen und 
durch sogenanntes fine-tuning angepasst werden. Insbesondere bei Sprachmo- 
dellen ist diese Vorgehensweise etabliert (siehe dazu weiter unten). Dies führt 
zur Übernahme von Bewertungsentscheidungen, die häufig nicht direkt und 
erst aus hochproblematischen Resultaten ersichtlich werden.* Insbesondere in 
den Bildwissenschaften wurde dieses Problem bereits erkannt, da aktuelle Bil- 
derkennungsmodelle häufig auf einem kleinen Set an bereits bestehenden Mo- 
dellen beruhen. 


TRAININGSKREISLAUF 


INITIALES 
TRAINING 


RE-TRAINING 


KORREKTION 


Abb. 1: „Cycle of bias.“ Abbildung von Viviane Blanchard und Tobias Hodel. 


Wenn wir noch einen Schritt weitergehen und als Drittes versuchen Texteinhei- 
ten (Sätze, Absätze oder Sinneinheiten) einem Thema zuzuweisen oder nach se- 
mantischen Gesichtspunkten zu segmentieren, bewegen wir uns sowohl im Be- 
reich des supervised als auch des unsupervised learning. Neben dem Trainieren 


4 Siehe dazu aktuelle Eindrücke zum Sprachmodell GPT-3 Tom B. Brown et al., „Language 
Models are Few-Shot Learners,“ arXiv:2005.14165 [cs], 22. Juli 2020, http://arxiv.org/abs/ 
2005.14165, Zugriff am 16.03.2022 von OpenAl. Beispielsweise anhand des GPT-3 basierten 
Spiels AI Dungeon: Tom Simonite, „It Began as an AI-Fueled Dungeon Game. It Got Much Dar- 
ker,“ Wired, 5. Mai 2021, https://www.wired.com/story/ai-fueled-dungeon-game-got-much-dar 
ker/, Zugriff am 28.02.2022. 
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von Annotationen (etwa fiir sentiment analysis), können auch Sätze (selten Satz- 
teile) aufgrund der vorkommenden Wörter zu Themenfeldern zusammengefügt 
werden (etwa mit topic modeling).° Text wird in den meisten dieser Verfahren 
als ‚bag of words‘ verstanden, die Reihenfolge der Wörter also ignoriert und nur 
auf Frequenzen von Zeichenfolgen geachtet. Als zentrale Einheit gilt in diesen 
Verfahren der Satz, der durch einen Punkt (von einigen Ausnahmen abgesehen) 
von der nächsten Einheit abgetrennt wird. Entsprechend lässt sich an dieser 
Stelle ein neuralgischer Faktor identifizieren, da viele vormoderne Sprachen 
keine Entsprechung zum Satz kennen und die Interpunktion nicht existiert be- 
ziehungsweise nicht zwangsläufig Sinneinheiten abtrennt. Das zweite Problem 
ist die Aufbereitung der zu identifizierenden Teile oder Themen. Wenn wir dies 
anhand des Beispiels von Urkundenteilen durchdenken, werden je nach Aus- 
gangsmaterial unterschiedliche Teile (etwa Protokoll, Kontext oder Eschatokoll) 
unterschiedlich stark gewichtet werden. Ein entsprechendes Training mit Über- 
nahme der kanonisierten Wertung ist möglich, führt aber unweigerlich zur Ver- 
stärkung impliziter und expliziter Bevorzugungen. Im deutschsprachigen Raum 
wären solche Bevorzugungen etwa die Prägung der Diplomatik durch die Ana- 
lyse ausgefertigter Königsurkunden im Gegensatz zu den zahlenmäßig massiv 
überwiegenden Urkunden, die unter dem Label „Privaturkunden“ zusammen- 
gefasst werden. 

Die drei kurz skizzierten Themenbereiche stellen unterschiedliche Phasen 
im Prozess der Quellenaufbereitung dar. Dabei zeigt sich sowohl in relativ simp- 
len Erkenn- oder Identifikationsprozessen als auch in komplexen Zuordnungen 
das Moment des Trainings als kritischer Vorgang, da die daraus generierten Mo- 
delle je nach Korpus (Ausgangsmaterial) in einen Modus des Nachahmens über- 
gehen. Das Verständnis der Modelle ist in der Konsequenz ein hermeneutischer 
Prozess, der, wie bereits von Gadamer gefordert, eine Auseinandersetzung mit 
(eigenen) Urteilen und insbesondere Vorurteilen miteinschließt und folglich 
den Prozess des Trainings nur so nachvollziehbar macht.® 


5 Zu Topic Modeling siehe auch David M. Blei, „Introduction to Probabilistic Topic Models,“ 
Communication of the ACM, 2011. 

6 Die Rolle des (Vor-)Urteils wird bei Gadamer aufgedröselt (und weniger stark als Problem 
aufgefasst): Hans-Georg Gadamer, Hermeneutik I: Wahrheit und Methode: Grundzüge einer phi- 
losophischen Hermeneutik, 7. Aufl., Bd. 1, Gesammelte Werke (Tübingen: Mohr Siebeck, 2010), 
270-290. (Seitenzahlen nach der 7. Auflage). 
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2 Interpretieren: Quellenkritik und Hermeneutik 


Über den Prozess des Trainings hinaus stellt der Umgang mit Resultaten des 
machine learning insbesondere aus Sicht der algorithm studies eine Herausfor- 
derung dar. Die Algorithmen lassen sich zwar an unterschiedlichen Stellen zu 
Ausgaben zwingen (bekannt sind die Google Image-Traum Algorithmen), je- 
doch ist ein Nachvollzug der Entscheide innerhalb neuronaler Netze bislang 
nicht erfolgreich möglich. Die Kritik und die Auswertung der Resultate aus Vor- 
gängen des maschinellen Lernens ähneln entsprechend hermeneutischen Inter- 
pretationen, die gerade durch den geschichtswissenschaftlichen Werkzeugap- 
parat wie der Quellenkritik, aber auch andere Methoden analysiert werden müs- 
sen. Erst das wechselseitige close- und distant-reading der Quellen und der 
Resultate macht es möglich, die Belastbarkeit der maschinell gewonnenen Wer- 
tungen zu überprüfen. 

Die Überprüfung der Fehler ist bei der Texterkennung auf den ersten Blick 
relativ simpel, da mehr oder minder standardisierte Transkriptionskonventio- 
nen existieren. Neue Erkennalgorithmen erreichen dabei, je nach Anzahl der 
Trainingsseiten, unterschiedliche Resultate. Für Handschriften ist eine Erkenn- 
qualität mit Fehlerquoten im Bereich von 2,5% technisch möglich, pro 1000 er- 
kannten Zeichen muss entsprechend mit 25 Fehlern gerechnet werden. In dieser 
Fehlerquote ist die fehlerhafte Erkennung von Satzzeichen sowie Groß-/Klein- 
schreibung bereits enthalten. Bei regelmäßigen Schriften wird diese Fehlerquo- 
te durch das Training eines entsprechenden Modells mit ungefähr 50 000 Wör- 
tern erreicht.” Dieses Resultat lässt sich unter optimalen Bedingungen, das 
heißt unter Beizug von genügend Material von ähnlichen Schriften, auch für 
Modelle erreichen, die auf unterschiedlichen Händen basieren.'® 


7 Alexander Mordvintsev, Christopher Olah und Mike Tyka, „Inceptionism: Going Deeper into 
Neural Networks,“ Google AI Blog, 17. Juni 2015, https://ai.googleblog.com/2015/06/inceptio 
nism-going-deeper-into-neural.html. Zugriff am 28.02.2022. 

8 Für die Literaturwissenschaften siehe als Beispiel: Ted Underwood, „Emerging conversati- 
ons between literary history and sociology,“ The Stone and the Shell, 02.12.2015, https://tedun 
derwood.com/2015/12/02/emerging-conversations-between-literary-history-and-sociology/, Zu- 
griff am 16.03.2022. 

9 Fiir dieses und andere Beispiele siehe Tobias Hodel, ,,Best-practices zur Erkennung alter 
Drucke und Handschriften - Die Nutzung von Transkribus large- und small-scale,“ in DHd 
2020. Spielräume Digital Humanities zwischen Modellierung und Interpretation, hg. v. Christof 
Schöch (dhd2020, Paderborn, 2020), 84-87, doi: 10.5281/zenodo.3666689. 

10 Siehe dazu auch Tobias Hodel, David Schoch, Christa Schneider, Jake Purcell, „General 
Models for Handwritten Text Recognition: Feasibility and State-of-the Art. German Kurrent as 
an Example,“ Journal of Open Humanities Data, 7(13) 2021, 1-10, doi: 10.5334/johd.46. 
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Es bleibt die Frage offen, inwiefern durch die Quantifizierung von Fehlern 
Aussagen zur Leistungsfahigkeit eines Erkennmodells gemacht werden können. 
Zentral sind aus historischer Perspektive schließlich die Fragestellung und die 
(digitale) Methode, die nach dem Erkennprozess zum Einsatz kommen sollen. 
Je nachdem fällt auch der Fehlertyp (Satzzeichen sind für topic modeling Algo- 
rithmen etwa unerheblich) oder die Art eines Fehlers (die Verwechslung von 
Stab-s mit „f“ führt im close reading zu keiner/wenig Verwirrung) ins Gewicht. 
Zukünftig wird es entsprechend wichtig sein, über quantifizierende Fehlerquo- 
ten hinaus, Angaben zur Fehleranfälligkeit eines Modells zu machen. 

Der Einsatz von Named Entity Recognition verlangt anders gelagerte Diskus- 
sionen. Wie bereits oben angesprochen, wird dabei ebenfalls der Trainingsinput 
imitiert. Auch dies basiert auf Sprachmodellen, sodass die kritische Analyse ei- 
nes solchen Modells Teil der Methodenkritik wird. Bei der Verwendung histori- 
scher Sprachformen entsteht jedoch zusätzlich das Problem, dass Sprachmodel- 
le auf verhältnismäßig kleinen Datenmengen basieren. 

Um die Leistungsfähigkeit bestehender Frameworks für nicht-standardisier- 
te vormoderne Sprachen zu demonstrieren, wurde im Rahmen des Editionspro- 
jekts Königsfelden ein Experiment zur Erkennung benannter Entitäten durchge- 
führt. Dabei wurde ein eigenes Sprachmodell (selbsttrainiert als FLAIR embed- 
dings)" angelegt, das auf zeitlich nahen historischen Dokumenten aus dem 15. 
und 16. Jahrhundert basiert. Das Training der benannten Entitäten basiert auf 
645 Urkunden, für Verhältnisse des maschinellen Lernens also insgesamt eher 
wenig Material. Eine Besonderheit bildet das Tagging des Editionsprojekts, das 
die Strategie verfolgt, alle potentiell zugehörigen Informationen einem Namen 
zuzurechnen. Dadurch wurden auch Angaben, die heute nicht mehr als Na- 
mensteil verstanden würden, als solcher markiert und folglich auch fürs Trai- 
ning verwendet. Trotz des geringen Umfangs der Trainingsdaten konnten F- 
Scores im Bereich von 69-74 % erreicht werden." 


11 FLAIR ist ein open-source Framework für Natural Language Processing: https://github. 
com/flairNLP/flair. Alan Akbik et al., „FLAIR: An Easy-to-Use Framework for State-of-the-Art 
NLP,“ in Proceedings of the 2019 Conference of the North American Chapter of the Association for 
Computational Linguistics (Demonstrations) (Minneapolis, Minnesota: Association for Compu- 
tational Linguistics, 2019), 54-59, doi: 10.18653/v1/N19-4010. 

12 Verwendet wurde das Bonner Frühneuhochdeutsch Korpus (http://www.korpora.org/Fnh 
dC/), digital vorliegende Bände der Schweizerischen Rechtsquellen (https://www.ssrq-sds-fds. 
ch/home/) und Urkunden und Akten des Klosters Königsfelden (https://www.hist.uzh.ch/de/ 
fachbereiche/mittelalter/lehrstuehle/teuscher/forschung/projekte/koenigsfelden.html, Zugriff 
am 16.03.2022). 

13 F-Scores kombinieren Recall (Ausbeute) und Precision (Präzision) und sind ein häufig ge- 
nutztes Mittel, um Klassifikatoren zu beurteilen. 
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Abb. 2: Drei Beispiele für „Fehler“ im Tagging. Da die Definition einer benannten Entität sehr 
weit gefasst wurde, ist auch die maschinelle rechte Spalte sinnvoll. Im rechten Beispiel zeigt 
sich ein Annotationsfehler. Die Auswertung erfolgte durch Ismail Prada. 


Dieser Wert ist für moderne Sprachen zwar nicht besonders hoch, zeigt aber das 
Potential des Ansatzes. Auch für dieses Verfahren lohnt sich ein Blick auf ein- 
zelne Resultate. Dadurch lässt sich eine Vielzahl von „Fehlern“ sichtbar ma- 
chen, die korrekte Resultate widerspiegeln. Die „Fehler“ stammen in diesen 
Fällen von Annotator:innen, die inkorrekt auszeichneten oder aber von der Ma- 
schine selbst, die gar valable alternative Annotationen (Namen können teilwei- 
se Orts- oder Personennamen bezeichnen) liefert.'* Einschränkend muss er- 
wähnt werden, dass die Transkription händisch erstellt und Eigennamen im Ge- 
gensatz zum restlichen Text großgeschrieben wurden. Die Algorithmen hatten 
entsprechend starke Indizien zur Identifikation von Entitäten. 

Stärker noch als bei der Texterkennung zeigt sich für Annotationsaufgaben, 
wie sehr die unterschiedlichen Inputs (Sprachmodell, Transkriptionsvorgaben 
und Trainingsmaterial) das Resultat beeinflussen. Eine Analyse der Technologie 
und der Resultate muss die Komplexität und Unsicherheitsfaktoren beispiels- 
weise von Annotationsaufgaben mitberücksichtigen, wobei aktuell der benötig- 
te Werkzeugkasten dazu noch mehrheitlich fehlt und wiederum quantitative 
Angaben nur beschränkt Aussagen zur Fähigkeit eines Netzes erlauben. 


14 Für diesen Versuch wurde nicht berücksichtigt, dass pooling von Wortvektoren (eigtl. eine 
Kontextualisierung innerhalb von Sätzen, indem auf vorangehende Wortvektoren zurückge- 
griffen wird) eine höhere Leistungsfähigkeit aufweisen. Alan Akbik, Tanja Bergmann und Ro- 
land Vollgraf, „Pooled Contextualized Embeddings for Named Entity Recognition,“ in Procee- 
dings of the 2019 Conference of the North American Chapter of the Association for Computational 
Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers) (NAACL-HLT 
2019, Minneapolis, Minnesota: Association for Computational Linguistics, 2019), 724-28, doi: 
10.18653/v1/N19-1078. 
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Bei der Analyse von Resultaten, die aus textbezogenen Annotationsaufga- 
ben entstanden sind, stellt der Einbezug von Sprachmodellen eine weitere Hür- 
de dar. Anhand von Vergleichen mit zur Verfügung gestellten Testdaten lässt 
sich aufzeigen, dass language models, die eine gewisse Größe aufweisen und 
mit den zu analysierenden Texten eng verwandt sind, bessere Resultate liefern. 
Es hängt bei dieser Aufgabe folglich nicht nur von der Menge an annotierten 
Daten ab, sondern auch vom Sprachmodell, welches als Ausgang gewählt wird. 

Wie bereits oben angesprochen, wird aus pragmatischen Gründen und teil- 
weise auch aus Gründen der Performanz auf vortrainierte Netze zurückgegrif- 
fen. Für moderne und von großen Firmen als zentral erachtete Sprachen (Eng- 
lisch, Französisch, Deutsch etc.) ist dies etwa BERT” beziehungsweise darauf 
aufbauende Varianten wie CamemBERT.'® Auch die bereits in den Fußnoten er- 
wähnten Modelle GPT-2 und GPT-3 fallen in die Kategorie der vortrainierten 
Netze. Allen Sprachmodellen ist gemein, dass sie jeweils zwar eine erhöhte Leis- 
tungsfähigkeit in der Problemlösung (typischerweise ausfüllen von Lückentex- 
ten) und der Annotation aufweisen, jedoch auf (Trainings-)Materialien zurück- 
greifen, die entweder überhaupt nicht publiziert oder insofern nicht nachvoll- 
ziehbar sind, als dass die Daten zwar zugänglich aber nicht mit Metadaten 
angereichert sind. Von Datenpublikation unter FAIR-Kriterien kann in keinem 
der Fälle gesprochen werden.” Die Konsequenz ist, dass wir weder die Grundla- 
gen beurteilen noch das Funktionieren der Modelle nachvollziehen können."® 

In einem weit experimentelleren Stadium als die Identifikation von Entitä- 
ten befindet sich die Zuordnung von Annotationen, die Sinneinheiten klassifi- 
zieren. Bereits etwas etabliert, vor allem da kommerziell interessant, ist dabei 
die sentiment analysis, die Sätzen meistens positiven oder negativen Gefühls- 
ausdrücken zuordnet. In der deutschsprachigen Digital Humanities Community 


15 Jacob Devlin et al., „BERT: Pre-training of Deep Bidirectional Transformers for Language 
Understanding,“ arXiv:1810.04805 [cs], 24. Mai 2019, http://arxiv.org/abs/1810.04805, Zugriff 
am 16.03.2022. 

16 Louis Martin et al., ,CamemBERT: A Tasty French Language Model,“ 9. Oktober 2019, HAL 
Id: hal-02445946. 

17 Mark D. Wilkinson et al., „The FAIR Guiding Principles for Scientific Data Management and 
Stewardship,“ Scientific Data 3, Nr. 1 (Dezember 2016): 160018, https://doi.org/10.1038/sda 
ta.2016.18. 

18 Ansätze in diese Richtung zum Verständnis von Sprachmodellen über Visualisierung wer- 
den aktuell getestet, siehe bspw. hier Challenge 4, https://www.cnd.philnat.unibe.ch/uebe 
r_uns/aktivitaeten/nlp_hackathon/ und das damit verbundene Poster: https://www.dh.uni 
be.ch/unibe/portal/fak_historisch/fsuf/d_dh/content/e330319/e336052/e1074527/PosterBDSD_ 
ger.pdf, Zugriff am 16.03.2022. 
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werden entsprechende Ansätze bereits intensiv bearbeitet und auch für ältere 
Sprachstufen vorbereitet.’ 

Analog dazu können auch andere, etwa thematische Labels vergeben und 
trainiert werden. Die bereits oben beschriebenen Probleme werden dabei über- 
nommen und die Komplexität nochmals um eine Stufe gesteigert, da die 
Sprachmodelle auf der Ebene „Satz“ angewandt werden. Das Verfahren wird 
dabei vom Wort (eigentlich token) auf eine Zeichenkette erweitert, die durch 
vordefinierte Stoppzeichen (Komma und [Doppel-]Punkte) abgetrennt werden. 
Das bedeutet, dass aus den hochdimensionalen Vektoren von Wörtern ein Vek- 
tor pro Satz errechnet wird, der gar auf ganze Texte erweitert werden kann. Da- 
durch lassen sich Textähnlichkeiten mathematisch über Cluster, also die Zu- 
sammenführung von nahen Vektoren, aufzeigen. Obwohl solche Verfahren be- 
reits seit einigen Jahren verfügbar und auch die informatischen Anforderungen 
an die Infrastruktur nicht unermesslich sind, sind es tendenziell literarische 
Texte, die diesbezüglich mit solchen Verfahren behandelt wurden.”° Mit spezifi- 
scheren Datensets, die etwa historische Textgattungen abbilden und entspre- 
chend das Erstellen von Sprachmodellen erleichtern, ist indes die Erweiterung 
der Einsatzgebiete in Sicht. 

Da typischerweise auf den Satz als einfach zu segmentierende Einheit Be- 
zug genommen wird, entstehen etwa für vormoderne Texte oder wenig gepfleg- 
te textuelle Formen (Stichwort: Kurznachrichten oder Social Media Posts) Her- 


19 Siehe Thomas Schmidt, Manuel Burghardt und Katrin Dennerlein, „‚Kann man denn auch 
nicht lachend sehr ernsthaft sein?‘ - Zum Einsatz von Sentiment Analyse-Verfahren für die 
quantitative Untersuchung von Lessings Dramen“ (Vortrag auf der DHd 2018 Kritik der digita- 
len Vernunft. 5. Tagung des Verbands „Digital Humanities im deutschsprachigen Raum“ (DHd 
2018), Köln, Zenodo, 26. Februar 2018), doi: 10.5281/zenodo.4622557; David Wodausch et al., 
„Hinterlistig - schelmisch - treulos - Sentiment Analyse in Texten des 19. Jahrhunderts: Eine 
exemplarische Analyse für Länder und Ethnien“ (Vortrag auf der DHd 2018 Kritik der digitalen 
Vernunft. 5. Tagung des Verbands „Digital Humanities im deutschsprachigen Raum“ (DHd 
2018), Köln, Zenodo, 26. Februar 2018), doi: 10.5281/zenodo.4622483. Siehe dazu auch die Res- 
source S. Clematide und M. Klenner, „Evaluation and Extension of a Polarity Lexicon for Ger- 
man,“ in Proceedings of the 1st Workshop on Computational Approaches to Subjectivity and Sen- 
timent Analysis (WASSA), hg. v. A. Montoyo et al. (Workshop on Computational Approaches to 
Subjectivity and Sentiment Analysis (WASSA); Held in conjunction to ECAI 2010 Portugal, Lis- 
bon, Portugal: University of Zurich, 2010), 7-13, doi: 10.5167/uzh-45506. 

20 Ted Underwood, „The Literary Uses of High-Dimensional Space,“ Big Data & Society 2, Nr. 2 
(1. Dezember 2015): 2053951715602494, doi: 10.1177/2053951715602494. Siehe auch einführend 
Ted Underwood und Matthew L. Jockers, „Text-Mining the Humanities,“ in A New Companion 
to Digital Humanities, hg. v. Susan Schreibman, Ray Siemens und John Unsworth (John Wiley & 
Sons, 2016), 291-306. 
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ausforderungen. Gerade fiir die angesprochenen Urkunden ist der Satz keine 
sinnvolle Einheit, um Zuordnungen zu erstellen. 

Mit Blick auf diesen dritten Themenbereich (Textteile einem Thema zuord- 
nen), stehen wir heute in einer initialen Findungsphase. Erste Modelle führen 
zu vielversprechenden Eindrücken, liefern jedoch noch zu wenig belastbare Re- 
sultate. Auch die Anwendung von topic modeling auf einzelne Sätze ist möglich, 
führt aber zu einem Clustering von ähnlichen Wortkonstruktionen und mahnt 
an die Auswertung von Kookkurrenzen. Aufschlüsse zu semantischen oder gar 
thematischen Feldern werden damit nur mittelbar gegeben.” 


3 Konsequenzen: Von einer neuen Heuristik zu 
einer neuen Epistemologie? 


Das Oszillieren zwischen praktischen Umsetzungen und theoretischen Überle- 
sungen führt zu neuen Problemstellungen, die Epistemologie und heuristische 
Methoden der Geschichtswissenschaften betreffen. Maschinelles Lernen zeigt 
sich dabei bereits heute als nützliche Erweiterung der Disziplin an der Schwelle 
des Einsatzes von big data, die es kritisch zu betrachten und zu verfolgen gilt. 
Die Einsichten dienen dabei nicht nur der intradisziplinären Methodendiskussi- 
on, sondern führen darüber hinaus zu kritischen Positionen für den Einsatz von 
deep learning im alltäglichen Leben. 

Die Nutzung von deep learning in einer hochgradig reflexiven Wissenschaft 
wie der Geschichtswissenschaft, bedeutet die Explizierung erkenntnistheoreti- 
scher Grundannahmen. Was etwa als „Text“ verstanden wird, muss offengelegt 
sein, wenn ein Algorithmus zur Erkennung von „Text“ gebracht wird.” Dabei 
regen auch einzelne Vorstufen von Texten die Diskussion an, etwa wenn identi- 
fiziert werden muss, wo sich auf einem Artefakt Text befindet. Die Identifikation 
von Personen oder Orten in textuellen Strukturen greift ebenso auf Vorannah- 


21 Siehe dazu auch Tobias Hodel, „Supervised and Unsupervised: Approaches to Machine 
Learning for Textual Entities,“ in Archives, Access and AI: Working with Born-Digital and Digi- 
tised Archival Collections, hg. v. Lise Jaillant (Transcript, 2021), 162-168. 

22 Tobias Hodel, „Konsequenzen automatischer Texterkennung - Ein Aufriss zur Texterken- 
nung mit Machine Learning,“ in DHd 2018. Kritik der digitalen Vernunft Konferenzabstracts. 
Universität zu Köln 26. Februar bis 2. März 2018, hg. v. Georg Vogeler (Köln, 2018), 249-251, 
http://dhd2018.uni-koeln.de/wp-content/uploads/boa-DHd2018-web-ISBN.pdf, Zugriff am 
16.03.2022; Patrick Sahle, Digitale Editionsformen. Zum Umgang mit der Überlieferung unter 
den Bedingungen des Medienwandels. Teil 3: Textbegriffe und Recodierung., Bd. 3, 3 Bde., 
(Norderstedt: BoD, 2013), http://kups.ub.uni-koeln.de/5352/. Zugriff am 28.02.2022. 
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men zurück, indem Fragen nach bedeutungstragenden Namen gegenüber von 
Zuschreibungen abgewogen werden müssen. Zentral wird dabei die Dokumen- 
tation der Aufbereitung von Grundlagen, die Bewertungsentscheide nachvoll- 
ziehbar macht. Indirekt lassen sich darauf aufbauend die Entscheide eines Mo- 
dells nachvollziehen. 

Gleichermaßen ist das Teilen der zugrunde liegenden Daten zentral, die 
eine Analyse der Annotations- und Bewertungsentscheide erlauben und somit 
das Problem des bias aktiv angehen. Die bereits existierenden und von diversen 
Forschungsförderanstalten eingeforderten FAIR-Richtlinien geben nicht nur 
diese Richtung vor, sondern lassen im akademischen Kontext fast keinen ande- 
ren Weg mehr zu. Anders sieht es bei der Nutzung kommerzieller Produkte oder 
Modelle aus, auf die weit weniger Zugriff besteht, die aber aufgrund ihrer Leis- 
tungsfähigkeit nicht komplett missachtet werden können. Der Umgang mit sol- 
chen Modellen muss im Kontext der ethical AI diskutiert und mit entsprechen- 
den Ansätzen angegangen werden, etwa durch die Zertifizierung (auditing) von 
Algorithmen.” 

Die Anwendung von maschinellen Lernverfahren erfordert somit nicht eine 
komplett neue historische Methode, sondern eine Erweiterung des technischen 
Horizonts, indem zumindest im Grundsatz die Verfahren verstanden werden 
müssen. Überdies ist eine konsequente Erweiterung der Hermeneutik auf einge- 
setzte Methoden notwendig, da nicht mehr nur das erforschte Material, sondern 
auch die technischen Herangehensweisen nie vollständig überblickt und auch 
nur in (langsamer) Annäherung verstanden werden können. 

Der machine learning turn führt nicht zu einer Abkehr von der historischen 
Methode, sondern vielmehr zu einer neuen Art der Beschäftigung mit Quellen, 
die nicht nur den Aussagewert beurteilt, sondern gleichzeitig auch die (automa- 
tisierte) Beschäftigung damit berücksichtigt. 
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Die Modellierung des zeitlichen Vergleichs 
als Kernkompetenz von Digital History? 


Fachliche Voraussetzungen und digitale Konzepte 


Abstract: An overview of research into time perceptions, time references and 
the handling of longitudinal and cross-sectional data compares various proce- 
dures and methods of historical research. It asks about similarities and differ- 
ences between classical and digital research topics and time-based methods 
and how both disciplines can meaningfully complement or enrich each other. 
In doing so, the hypothesis is put forward that digital methods can not only pro- 
vide important impulses for longitudinal analyses across disciplines through 
mass data analyses, but that historical research can usefully complement the 
„fracture category“ of time („qualitative research“) by looking for similarities. 
In doing so, the author emphasises the necessity of common standards for 
methods and digital working procedures in order to actually generate secure 
foundations for scientific work. 


Keywords: time perception, ages, employment research, entity recognition, me- 
thods, longitudinal analysis, digital history 


Zusammenfassung: Ein Uberblick zur Erforschung von Zeitwahrnehmungen, 
Zeitbezügen und des Umgangs mit längs- und querschnittsbezogenen Daten 
vergleicht verschiedene Verfahren und Methoden der historischen Forschung. 
Gefragt wird nach Gemeinsamkeiten und Unterschieden von klassischen und 
digitalen Forschungsthemen und zeitbasierten Methoden und wie sich beide 
Fachrichtungen sinnvoll ergänzen oder bereichern können. Dabei wird die The- 
se aufgestellt, dass digitale Methoden durch Massendatenanalysen nicht nur 
fachübergreifend wichtige Impulse zu Längsschnittanalysen setzen können, 
sondern geschichtswissenschaftliche Forschung die „Bruchkategorie“ der Zeit 
(„qualitative Forschung“) durch Sichtungen nach Gemeinsamkeiten sinnvoll er- 
sänzen. Dabei betont die Autorin die Notwendigkeit von gemeinsamen Stan- 
dards für Methoden und digitalen Arbeitsverfahren, um tatsächlich gesicherte 
Grundlagen wissenschaftlichen Arbeitens zu erzeugen. 


Schlagwörter: Zeitwahrnehmung, Alter, Berufsforschung, Entitätserkennung, 
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Zeit als Forschungsparadigma ist der Geschichtswissenschaft als ureigener in- 
nerer Kern und Gegenstand eingeschrieben: „Man kann nicht sagen, daß etwas 
ist, ohne zu sagen, was es ist. Indem man sie denkt, bezieht man Fakta schon 
auf Begriffe, und es ist doch wohl nicht einerlei, auf welche,“ zitiert Reinhart 
Koselleck in seiner Auseinandersetzung mit methodischen Fragen der Quellen- 
kritik und Historizität bereits Friedrich Schlegel.! Der Wandel der Begrifflichkei- 
ten, ihre Veränderlichkeit in der Zeit, ihre rezeptiven Nachwirkungen sowie die 
Ausgestaltung von Transformationsprozessen bilden eine der Hauptachsen his- 
torischer Forschung. Sogar die Kulturgeschichte der Zeitlichkeit selbst,? die Ent- 
stehung von Zeitbewusstsein, das Nebeneinander verschiedener Zeitordnun- 
gen, die Wahrnehmung und Strukturierung des Alltags und der Ökonomie 
durch Zeitregime standen und stehen seit einigen Jahren wieder verstärkt im 
Mittelpunkt einer umfassenden Analyse und von Diskussionen.’ Dabei reprä- 
sentiert die Zeit paradigmatisch die Veränderlichkeit von Begrifflichkeiten, den 
Wandel und den Neubeginn. Zeit ist damit eine Dimension der Transformation 
und des Bruchs, könnte man zahlreiche Forschungsansätze zusammenfassen. 
Zeit ist zudem kein gleichförmiger Fluss, sondern sie wird in der Moderne oder 
Postmoderne zunehmend als „Beschleunigung“ erlebt oder auch in Form von 
Zeitkonkurrenzen, wird als Abweichung von zeitlicher Ordnung im Sinne der 
Naturwissenschaft markiert.” Diese Beschreibungen verweisen auf die verschie- 
denen Dimensionen von Zeit, die als subjektiv erlebte Prozesse auf das Indivi- 
duum gerichtete Analysen beschreiben.’ Dabei scheinen auch das Wiederkeh- 


1 Reinhart Koselleck, Vergangene Zukunft: Zur Semantik geschichtlicher Zeiten (Frankfurt a.M.: 
Suhrkamp, 2010), 349. 

2 Albrecht Franz und Katja Patzel-Mattern, „Annäherungen an einen kulturwissenschaftlichen 
Zeitbegriff,“ in Der Faktor Zeit: Perspektiven kulturwissenschaftlicher Zeitforschung, hg. v. Katja 
Patzel-Mattern und Albrecht Franz (Stuttgart: Franz Steiner Verlag, 2015), 10. 

3 Arndt Brendecke (Hg.), Die Autorität der Zeit in der Frühen Neuzeit (Berlin: LIT-Verl., 2007); 
Erhard Chvojka, Andreas Schwarcz und Klaus von Thienen (Hg.), Zeit und Geschichte: Kultur- 
geschichtliche Perspektiven (Wien, München: R. Oldenbourg Verlag, 2002); Ilse E. Plattner, Zeit- 
bewußtsein und Lebensgeschichte: Theoretische und methodische Überlegungen zur Erfassung 
des Zeitbewußtseins (Heidelberg: Asanger, 1990); Elmar Schenkel und Kati Voigt (Hg.), Verwei- 
le doch ...: Uber die Erforschung der Zeit (Leipzig: Edition Hamouda, Oktober 2015); Achim 
Landwehr (Hg.), Frühe Neue Zeiten: Zeitwissen zwischen Reformation und Revolution (Bielefeld: 
transcript, 2012); Gerald James Whitrow, Time in History: Views of Time from Prehistory to the 
Present Day (Oxford: Oxford Univ. Press, 1991). 

4 Albrecht Franz und Katja Patzel-Mattern, „Annäherungen“, 11. 

5 Plattner, Zeitbewußtsein und Lebensgeschichte. 
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rende und die rhythmische Ausgestaltung der Zeit zwar immer wieder auf,° blei- 
ben in vielen Darstellungen jedoch weitgehend im Hintergrund. Mit den Mitteln 
der hermeneutischen Analyse, des qualitativen Vergleichs und der historischen 
Quellenkritik - so kann man als Zwischenfazit festhalten — gelingt es uns her- 
vorragend, zeitlichen Wandel inhaltlich mehrdimensional und quellenkritisch 
zu fassen, wenn die Zeitdimension damit einerseits den Bruch und die Abwei- 
chung vom Alltäglichen oder „Normalen“, andererseits vor allem die subjekti- 
ven und kulturell wandelbaren Wahrnehmungen neben der objektiv messbaren 
Zeit beschreibt. 

Zeit ist damit notwendigerweise auch für die Digital Humanities und die Di- 
gital History ein zentrales Thema, vor allem, wenn sie wie häufig angemahnt, 
nicht einem bloßen Selbstzweck dienen soll, sondern produktive Ziele der histo- 
rischen Erkenntnismehrung ihrer eigenen geisteswissenschaftlichen Herkunfts- 
disziplin verfolgt.” Dennoch scheint gerade am Beispiel der Zeit kaum ein direk- 
ter Anknüpfungspunkt zwischen der aktuellen Diskussion der oben erwähnten 
und auf die „Zeit“ bezogenen historischen Debatte und den Digital Humanities 
zu bestehen. Dies zeigt bereits ein nur beispielhafter und damit unvollständiger 
Blick auf wichtige Projekte der Digital History, die sich mit dem zeitlichen Wan- 
del beschäftigen. 

Ein frühes, visuell ansprechendes, hochrangig in der Zeitschrift „Science“ 
publiziertes und in der Öffentlichkeit sehr positiv rezensiertes Projekt - und da- 
mit für viele bis heute impulsgebend - kartierte unter dem Titel „A network 
framework of cultural history“ Merkmale von Kultur in Raum und Zeit.® Lebens- 
zeiten wurden hier für das Entstehen und Vergehen von kulturellen Epochen 
sichtbargemacht. Entgegen der staunenden Öffentlichkeit kritisierten Histori- 
ker:innen und Expert:innen der Digital Humanities das Projekt jedoch grundle- 
gend, weil es basale Prinzipien der Quellenkritik, vor allem jedoch der adäqua- 
ten fachwissenschaftlichen Operationalisierung von Fragestellungen, Metho- 
den, Quellenanalyse und der damit gewonnenen Erkenntnisse verletzte, 
darunter fundamentale Prinzipien der Repräsentativität und Plausibilität von 
Daten. Als Fazit formulierte Rehbein sehr grundlegend: „dass wer die Entste- 
hung und Verarbeitung von Daten nicht nachvollziehen kann, diese nicht in- 


6 Alexander Deeg, „Advent ist immer,“ in Verweile doch ...: Über die Erforschung der Zeit, hg. v. 
Elmar Schenkel und Kati Voigt (Leipzig: Edition Hamouda, Oktober 2015), 99-106; Birgit Jo- 
chens, Deutsche Weihnacht: Ein Familienalbum 1900-1945 (Berlin: Nicolai, 2011). 

7 Malte Rehbein, „Digitalisierung braucht Historiker/innen, die sie beherrschen, nicht be- 
herrscht,“ https://www.hsozkult.de/debate/id/diskussionen-2905. Zugriff am 19.02.2022. 

8 Maximilian Schich et al., „Quantitative Social Science. A Network Framework of Cultural 
History,“ Science 345/6196 (2014): 558-562. 
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nerhalb von historischer Forschung verwenden darf.“? Diese Kritik umfasst ein 
Grundproblem der Digital History, welche mit jedem einzelnen Projekt eine 
Vielzahl von fachspezifischen, technischen, informatischen und statistischen 
methodischen Kompetenzen bedürfte, die sich unterhalb von Leuchtturmpro- 
jekte oft aber gar nicht in dieser Interdisziplinarität bündeln lassen. Gleichzeitig 
braucht es im jungen Fach eben auch noch erst viele basale Voraussetzungen, 
um überhaupt an die komplexen Fragestellungen des eigenen Faches anknüp- 
fen zu können. Gleiches gilt auch für andere beteiligte Fachdisziplinen, denn so 
ist bereits das Innenverhältnis von Statistik und Informatik häufig nicht konso- 
lidiert. Viele Analysen, die Software und Programme heute ermöglichen, ent- 
sprechen nicht unbedingt den Standards oder den ausgewiesenen Anwen- 
dungsbereichen konsolidierter statistischer Verfahren. Vergleichbar ist dies 
vielleicht mit der Verwendung von Medikamenten zur Heilung von Krankhei- 
ten, die aber eben nicht geprüft und zugelassen sind. Es mag sein, dass solche 
Verwendungen zu einem guten Ergebnis führen. Der umgekehrte Fall ist jedoch 
ebenso möglich. Es braucht daher einen intensivierten Verständigungsprozess 
nicht nur über Formen der digitalen Quellenkritik, sondern auch zu verlässlich 
anzuwendenden Methoden und Verfahren. 

Diese Problematik erweist sich auch für die Projekte noch als relevant, die 
nun einige Jahre später den Faktor „Zeit“ operationalisierbar machen möch- 
ten.! Zentrales Anliegen ist dabei vorwiegend die Modellierung von histori- 
schen Daten, um sie einerseits gemäß von informationellen Anforderungen for- 
mal adäquat, aber eben auch entsprechend der problembehafteten Quellen- 
und Datensituation passfähig erheben zu können. Fundamental treten dabei 
die Herausforderungen auf der technischen und informatischen Ebene zur „Mo- 
dellierung des Zweifels“ " hervor, die in direkter Liaison zur Ungenauigkeit und 
Relativität vieler Quelleninformationen stehen, die sich ja beileibe nicht nur auf 
Zeitdimensionen beziehen. Dabei konzentrieren sich viele Analysen - selbst bei 
einer Orientierung auf fachwissenschaftliche Voraussetzungen - dennoch viel- 
mehr auf eine modellierungstechnische und informatisch möglichst präzise Be- 


9 Malte Rehbein, „Digitalisierung“. 

10 Vgl. Programm und Berichte zur Tagung: Data for History 2021: Modelling Time, Places, 
Agents, Berlin 2021, https://d4h2020.sciencesconf.org/, die bisher noch unpubliziert sind. Zu- 
griff am 19.02.2022. 

11 Andreas Kuczera, Thorsten Wübbena und Thomas Kollatz, „Die Modellierung des Zweifels — 
Schlüsselideen und -konzepte zur graphbasierten Modellierung von Unsicherheiten. Zur Ein- 
führung in diesen Band,“ in Die Modellierung des Zweifels — Schlüsselideen und -konzepte zur 
graphbasierten Modellierung von Unsicherheiten, hg. v. Andreas Kuczera, Thorsten Wübbena 
und Thomas Kollatz (Wolfenbüttel: Herzog August Bibliothek, 2019) 2019, doi: 10.17175/ 
sb004_013. 
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schreibung und Sichtbarmachung von Unsicherheit, die vor allem an Lösungen 
zur Informationsweiterverarbeitung und des Informationsaustausches anknüp- 
fen.” Dabei geht es vor allem um die semantische Verknüpfung (Linked Open 
Data, Ontologien) und Vernetzung von Wissenskonzepten in webbasierten Da- 
tenbanken und Angeboten, die heute auch als Wissensgraphen diskutiert wer- 
den. Im Ergebnis wird unter anderem moniert, dass die exakte Darstellung und 
Modellierung auch Erkenntnisprozesse und epistemologische Voraussetzungen 
der Analysen verändern, wie etwa Martin Raspe und Georg Schelbert auch an- 
hand von aktuellen Modellierungs- und Visualisierungsprozessen von kultur- 
historischen Objekten darlegen konnten und wie sie auch im Rahmen der ersten 
Digital History-Tagung ausgiebig problematisiert wurden. Weil solche Visuali- 
sierungen oder notwendigen Modellierungsvorgänge fehlende Informationen in 
analysierbare Details verwandeln, müssen wir eben methodische Ansätze dis- 
kutieren und zu Standards entwickeln, damit sie dann auch in den komplexen 
Datenstrukturen und im Gestrüpp des Internets noch sichtbar werden." 

Was sicherlich für die Weiterentwicklung von Modellierungstechniken, Re- 
cherche- und Kontextualisierungsoptionen von webbasierten Quellen innovati- 
ve Impulse setzt und fraglos eine wichtige Rolle erfüllt, bleibt für die fragestel- 
lungsgeleitete aktuelle Forschung jedoch häufig noch zu rudimentär oder viel- 
leicht besser gesagt, ein zu sehr auf seine technischen Dimensionen verengtes 
Problem, dass aber eben doch viele inhaltliche Herausforderungen adressiert. 
Allerdings werden mit der bisherigen Diskussion vor allem Dimensionen von 
fehlenden oder unsicheren Werten und grundsätzlich die entitätsspezifische 
Modellierung von Daten berührt, weil viele Projekte noch nicht mit der Analyse 
von Ergebnissen beschäftigt sind. Im Sinne der vorab geschilderten Anschluss- 
fähigkeit zur Zeitforschung und zur Beschäftigung von Digital History mit Fra- 
gen des Wandels von Begrifflichkeiten müsste dagegen viel stärker die Opera- 
tionalisierung und Modellierung von hermeneutischen Erkenntnisprozessen in 
den Vordergrund treten und die Überführung von subjektiven und objektiven 
Dimensionen in auswertbare Kategorien thematisiert werden. 


12 Dominik Kasper und Andreas Kuczera, „Modellierung von Zweifel — Vorbild TEI im Gra- 
phen,“ in Modellierung des Zweifels, hg. v. Kuczera, Wübbena und Kollatz, doi: 10.17175/ 
sb004_003; Andreas Wagner, „Ambiguität und Unsicherheit: Drei Ebenen eines Datenmo- 
dells,“ in Modellierung des Zweifels, hg. v. Kuczera, Wübbena und Kollatz, doi: 10.17175/ 
sb004_007. 

13 Martin Raspe und Georg Schelbert, „Genau, wahrscheinlich, eher nicht: Beziehungsproble- 
me in einem kunsthistorischen Wissensgraph,“ in Modellierung des Zweifels, hg. v. Kuczera, 
Wübbena und Kollatz, doi: 10.17175/sb004_012. 
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Dieser Aspekt berührt sehr alte „Problemzonen“ der methodischen Heraus- 
forderungen von Natur- und Geisteswissenschaften und ihren jeweiligen Beson- 
derheiten auch in der Geschichtswissenschaft. Sie nimmt damit auch grund- 
sätzliche Herausforderungen und Diskussionspunkte wieder auf, die besonders 
in den 1990er Jahren zu einer langandauernden Trennung von Statistik und Ge- 
schichtswissenschaft führten.'* Dennoch knüpfen solche Forschungen der Digi- 
tal History trotz aller fachlichen Detailfragen bisher weder direkt an eigene The- 
men der Geschichtswissenschaft” noch an Themen der Historischen Hilfswis- 
senschaften an. So schließen die Ansätze der Zeitmodellierung innerhalb von 
Digital History nur vermittelt an die Ziele der „Chronologie“ an. Vielleicht bildet 
sich die größte Schnittfläche noch dort aus, wo man mithilfe eines standardi- 
sierten Verfahrens und von Normdaten die verschiedenen Dimensionen von 
Zeit in eine objektive Messbarkeit!© und mit entsprechenden Standards der Ge- 
dächtnisinstitutionen in gemeinsame Notationen” bringen möchte. 

Auffällig kehrt sich bei diesen Bemühungen jedoch der eigentliche Umgang 
mit der Zeit um. Denn diese Ansätze verfolgen erst einmal nicht den Bruch in 
der Zeit, sondern schaffen vielmehr eine Basis zur Vergleichbarkeit von Prozes- 
sen. Ähnliche Ansätze lassen sich auch in den wirtschaftshistorischen, ökono- 
mischen und sozialwissenschaftlichen Studien wiederfinden, '® die über quanti- 
tative Forschungen langfristige Vergleiche im Kontext von Zeitreihenanalysen 
erforschen und dabei auch die methodischen Schwierigkeiten der statistischen 
Forschung beschreiben. Ein wunderbares Beispiel für den hohen Wert und die 
Grenzen eines solchen Unterfangens bietet das von Thomas Rahlf herausgege- 
bene Buch „Deutschland in Daten“. Wie alle reflektierten Autor:innen seiner 
Zunft fragt er natürlich auch nach der Sinnhaftigkeit und der Möglichkeit, über 
verschiedene politische Systeme und Brüche hinweg Jahr für Jahr Daten anein- 
anderzureihen, um eine Vergleichbarkeit der ermittelten Daten herzustellen. 
Vergleicht man also Äpfel mit Birnen, wenn man über lange Zeitreihen hinweg 
und aus aggregierten Statistiken heraus Informationen verschneidet? Oder 


14 Thomas Rahlf, „Einleitung,“ in Deutschland in Daten: Zeitreihen zur Historischen Statistik, 
hg. v. Thomas Rahlf, 5-12 (Bonn: bpb Bundeszentrale für Politische Bildung, 2015), 6. 

15 Thomas Rahlf, „Voraussetzungen für eine Historische Statistik von Deutschland (19./20. 
Jahrhundert),“ Vierteljahrschrift für Sozial- und Wirtschaftsgeschichte 101/3 (2014): 322-352. 
16 Anna-Dorothee von den Brincken, Historische Chronologie des Abendlandes: Kalenderrefor- 
men und Jahrtausendrechnungen; eine Einführung (Stuttgart: Kohlhammer, 2000); Hermann 
Grotefend, Taschenbuch der Zeitrechnung des deutschen Mittelalters und der Neuzeit (Hanno- 
ver: Hahn, 2007). 

17 Zentral ist hier die ISO 8601: Date and Time Format; momentan in der Fassung ISO 8601- 
1:2019 und ISO 8601-2:2019. 

18 Rahlf, „Voraussetzungen,“ 333-345. 
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müssten diese vielleicht nicht doch besser über perioden- und epochenspezifi- 
sche zeitlich kurzatmigere Daten präsentiert werden? Trotz dieser Fragen ent- 
schied sich Rahlf nicht zufällig für die langfristigen Betrachtungen mit großen 
Entwicklungslinien und Strukturbrüchen, die heutige oft auf die Mikrogeschich- 
te gerichtete Erkenntnisse wesentlich ergänzen können. Wie auch Rehbein oder 
die zahlreichen Autor:innen zur Modellierung des Zweifels in der Digital History 
kommt auch Rahlf letztlich zum Fazit: Alles ist eine Frage der wissenschaftli- 
chen Redlichkeit, der Methodik und der Quellenkritik'? und schließlich natür- 
lich auch einer passfähigen und realistischen Einordnung von Forschungser- 
gebnissen. Dabei präsentiert auch sein Band jedoch für die Statistik des 19./20. 
Jahrhunderts nur einen Exkurs über die Besonderheiten der DDR-Statistik auf- 
grund ihrer Orientierung an den Berechnungsmodalitäten der Sowjetunion und 
der Funktion von Statistik in einer Diktatur,” während spezifische Herausforde- 
rungen der Interpretation beziehungsweise die ausführliche Quellenkritik für 
Statistiken vor der Gründung des Kaiserreiches und dem Beginn der offiziellen 
Statistik mit der Reichsgründung, in der Weimarer Republik und im Nationalso- 
zialismus dann doch auffällig fehlen, für die natürlich auch strukturelle Beson- 
derheiten prägend waren. 

Letztlich liegt vielleicht genau hierin ein hohes Integrationspotential, dass 
nicht nur Geschichtswissenschaft, Historische Hilfswissenschaften, Wirtschafts- 
geschichte und Digital History zusammenbringen kann, sondern eben auch ei- 
nen wesentlichen Mehrwert für ein interdisziplinäres Setting von Methoden der 
Nachnutzung und Langzeitanalyse bietet.” Eine ganz wesentliche Stärke und 
Fachkompetenz der Historiker:innen liegt ja genau darin, methodische Heran- 
gehensweisen für Längsschnittanalysen oder überhaupt zeitliche Vergleiche für 
den Wandel von Begrifflichkeiten zu entwickeln und den Umgang mit verschie- 
denen Herausforderungen zur Bestimmung von Repräsentativität in sich wan- 
delnden und unsicheren Dimensionen, von Plausibilität und Modellierung und 
zur Imputation oder Visualisierung des Quellenverlusts zu markieren. Dabei 
können sich Digital History, klassische Historische Hilfswissenschaften und 
Fachwissenschaften äußerst positiv ergänzen. 


19 Rahlf, „Einleitung,“ 7. 

20 Andre Steiner, „Die DDR-Statistik: Probleme und Besonderheiten,“ in Deutschland in Daten, 
hg. v. Rahlf, 13-17. 

21 Katrin Moeller, „Grundwissenschaften als Masterdisziplin der Nachnutzung,“ in: Eva 
Schlotheuber, Rüdiger Hohls und Claudia Prinz (Hg.), Diskussionsforum: Grundwissenschaften 
als Masterdisziplin der Nachnutzung. H-Soz-Kult 2015 (2015). http://www.hsozkult.de/debate/ 
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Dazu ist zunächst eine Systematisierung von methodischen Herausforde- 
rungen und ihren bestehenden Lösungsansätzen notwendig und die fachwis- 
senschaftliche Klärung, wann und wie Zeitdimensionen nun überhaupt objekti- 
ve oder subjektive Prozesse, Wandel, Bruch oder Ähnlichkeit messen bezie- 
hungsweise konstatieren können. Dabei ist zunächst kritisch anzumerken, dass 
der Vergleich erst einmal eine Methodik gewähren muss, die nicht Wandel/Per- 
sistenz vorwegnimmt, sondern beides als Ergebnis des Vergleichs analysieren 
kann, was nicht immer berücksichtigt wird. 

Während diese Verfahren im Bereich der Statistik häufig schon allgemeiner, 
jedoch nicht unbedingt fachspezifisch beschrieben sind, bleiben sie im Bereich 
der qualitativen Forschung und Hermeneutik jedoch weniger konkret greifbar. 
Dabei ist zugleich unsere schroffe Grenzziehung zwischen quantitativen und 
qualitativen Methodiken zu hinterfragen. So räumt die Geschichtswissenschaft 
einem zeitübergreifenden Vergleich von metrischen Daten - etwa in Form einer 
Altersreihe — unwillkürlich mehr Plausibilität ein, als dies bei nominalen oder 
kategorialen Daten — wie etwa dem Beruf - der Fall ist. Es soll später noch hin- 
terfragt werden, ob diese Annahmen so eigentlich plausibel sind. Vielmehr 
scheint es einer Diskussion wert, ob nicht die Altersangabe historisch viel frü- 
her einen Prozess der Systematisierung, Operationalisierung und Standardisie- 
rung erlebt hat, als viele andere Terminologien, hier als Beispiel eben der Beruf, 
und damit messbar geworden ist. Dabei handelt es sich letztlich darum, eine 
einzelne Eigenschaft eines komplexen Begriffes herauszugreifen und atomisiert 
messbar zu machen (eine Grundregel, die heute in der Informatik und in den 
Digital Humanities unter dem Entity Relationship Modell firmiert).” Unter einer 
Altersangabe wird nun daher bevorzugt die metrisch messbare Altersangabe als 
Lebensspanne in Jahren vom Geburtsdatum an verstanden. Dennoch gibt es in 
den verschiedenen fachwissenschaftlichen Sparten wie Psychologie, Medizin 
oder Soziologie natürlich auch die verschiedensten Ansätze, um das bio- 
logische, gefühlte, geistige, generative oder körperliche Alter zu messen.” Glei- 
ches gilt auch für den komplexen Begriff des Berufes, der natürlich auch in Tä- 
tigkeitsprofile, Anforderungsniveau, Identitätskonzepte, sozialhierarchische 
Strukturen, Karrieremodelle und weiteres zerfällt und für unterschiedliche For- 
schungen auch im Längsschnittkonzept messbar gemacht werden kann. 


22 Ramez Elmasri und Sham Navathe, Fundamentals of Database Systems, Always Learning 
(Boston u.a.: Pearson, 2017). 

23 Pitirim A. Sorokin und Robert K. Merton, „Social Time: A Methodological and Functional 
Analysis.“ The American Journal of Sociology 42/5 (1937): 615-629. https://www.jstor.org/sta 
ble/2767758, 615-616. Zugriff am 19.02.2022. 
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Eine punktuelle Betrachtung von Herausforderungen in beiden Bereichen 
soll an dieser Stelle helfen, grundlegende Aufgaben zu skizzieren und zu syste- 
matisieren. Darüber hinaus sollen sie zeigen, dass gerade die Spezifik der Da- 
tenlandschaft des „vorstatistischen“ Zeitalters in Verknüpfung mit dem „statis- 
tischen“ Zeitalter ähnliche Herausforderungen erbringt, wie für die Verbindung 
von quantitativen und qualitativen Ansätzen. Dabei scheint es für die gesamte 
Geschichtswissenschaft sehr gewinnbringend zu sein, sich Gedanken über die 
Lösung solcher Problematiken zu machen, da diese im Jahrhundert des digita- 
len Zeitalters und der Daten wichtige interdisziplinäre Antworten auf methodi- 
sche Herausforderungen geben können.” 


Quellengrundlage und Vergleichbarkeit - 
Mikrodaten und Makrodaten 


Grundlegend braucht es auch in der digitalen Geschichtswissenschaft kreative 
Ideen und Verständigungsprozesse dazu, wie mit den Quellenverlusten und 
Quellenbrüchen beim zeitlichen Vergleich umgegangen werden kann, die im- 
mer mit veränderten Mess- und Erfassungsweisen verbunden sind. Statistisch 
gesehen ist es weitgehend möglich, über Imputationsverfahren fehlende Quel- 
len mit Schätzungen oder Hochrechnungen auszugleichen.” Inhaltlich bleibt 
die Frage offen, welche Vorgehensweisen in der weiteren Fachwissenschaft An- 
wendung und Akzeptanz finden und wie diese sichtbar gemacht werden.”° Zum 
Teil verzichten gerade Gedächtnisinstitutionen und historische Forschung ex- 
plizit auf verlorengegangenes Wissen, um die Lücken demonstrativ sichtbar zu 
machen. Beide Richtungen existieren auch in der Statistik, was allerdings in der 
Analyse von Zeit dann wiederum zu fehlenden und damit verfälschenden Be- 
rechnungsgrundlagen führt. Während zudem in der quantitativen Methodik 
fehlende Werte und ihre Ergänzungen in den verschiedenen Qualitäten hervor- 
treten, sucht man solche Betrachtungen in der hermeneutischen Forschung 
häufig vergeblich, weil hier das Existente unmittelbar in die Analyse eingeht 
und dann das „nicht Auffindbare“ quellenkritisch nicht immer unmittelbar in 


24 Moeller, „Grundwissenschaften“. 

25 Christian F.G. Schendera, Datenqualität mit SPSS (München: Oldenbourg, 2011), 119-161. 
26 In der Psychologie führte etwa ein Aufsatz zu Imputationsverfahren zu mehreren Repliken: 
Oliver Lüdtke et al., „Umgang mit fehlenden Werten in der psychologischen Forschung: Pro- 
bleme und Lösungen.“ Psychologische Rundschau 58 (2007): 103-117, doi: 10.1026/0033- 
3042.58.2.103. 
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der Analyse reflektiert wird. Zudem gibt es bekanntlich ganz unterschiedliche 
Ursachen für „fehlende Informationen“. 

Welche weiteren Arten von Schwierigkeiten treten nun bei der Konzeption 
einer „langen Reihe“ auf? Worüber müssen wir also Verständigungsprozesse 
einleiten? Mit dieser Frage soll sich ein kleiner Exkurs zur Entstehung einer 
Zeitreihe des Sterbealters im Vergleich mit Berufstätigkeiten der gleichen Quelle 
beschäftigen, der zusätzlich den Mehrwert von Digital Humanities unterstreicht. 
Die hier verwendete Datenreihe stammt zum Teil aus einer Totalerhebung von 
Kirchbuchdaten der Gemeinde „Unser Lieben Frauen“ (heute Marktkirche) der 
Stadt Halle zwischen 1670 und 1820.” Ergänzt wurde dieser Datensatz im Rah- 
men eines Schülerforschungsprojekts”® für das 19. und 20. Jahrhundert mit den 
aggregierten Sterbedaten. Die Zeitreihe erfasst damit jährliche Rohdaten über 
den Zeitraum von 450 Jahren (rohe Sterbeziffern ohne Alter) beziehungsweise 
350 Jahren (altersspezifische Sterbeziffern) und repräsentiert damit einen unge- 
wöhnlich langen Zeitraum, der in dieser Form nur sehr selten zur Analyse 
kommt. Für das Forschungsvorhaben waren die Totgeburten sowie die Sterb- 
lichkeit von Säuglingen und jeweils zehn Jahre umfassende Alterskohorten 
möglichst differenziert nach Geschlecht die Wunschvorstellung für das ideale 
Untersuchungsset. Dies diente zur Grundlegung einer Fragestellung, die im An- 
schluss an demografische Forschungen nach der prinzipiellen Begrenztheit 
oder Unbegrenztheit menschlicher Lebenszeit fragte.” Solche Analysen sind in 
Halle/Saale ab dem Ende des 16. Jahrhunderts möglich, weil erst ab diesem Zeit- 
raum überhaupt serielle Quellen mit Altersangaben zur Verfügung stehen. 

Für die Zeitreihe war einerseits die Ausdifferenzierung innerhalb der Quelle 
zu beobachten, wobei es auch immer wieder die bekannten Brüche in der Re- 
präsentation der seriellen Quelle gab, wenn beispielsweise ein neuer Küster 
oder Pfarrer die Führung der Sterberegister übernahm. Zwar wurden von Be- 
sinn an mehr oder weniger individuelle Namen und das Geschlecht der verstor- 
benen Personen genannt, weitere Informationen gab die Quelle jedoch erst im 
Verlauf der Jahrhunderte. So traten ab ungefähr 1660 Informationen zu Beru- 
fen, ab den 1730er Jahren sogar die Todesursachen und ab den 1760er Jahren 
räumliche Informationen (Adressen) hinzu, die später aber auch zeitweise wie- 


27 Katrin Moeller und Petra Kühne, Sterberegister der Mariengemeinde Halle (Saale) 1670- 
1820, hg. v. Historischen Datenzentrum Sachsen-Anhalt, Halle 2014, doi: 10.25673/14112. 

28 Jakob Moeller und Katrin Moeller, „Pandemien und Sterblichkeitskrisen in der Geschichte 
Halles (1579 bis 2018).“ Preprints und Working Paper, hg. v. Historischen Datenzentrum Sach- 
sen-Anhalt, Halle 2020, doi: 10.25673/32869. 

29 Jim Oeppen und James W. Vaupel, „Demography. Broken Limits to Life Expectancy,“ Sci- 
ence 296/5570 (2002): 1029-1031. 
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der verschwinden konnten. Grundsätzlich lieferte jedoch die Mikrodatenerhe- 
bung - wenn auch mit spezifischen Unschärfen (zum Beispiel beim Geschlecht 
von Totgeburten und Säuglingen) alle für die Forschungsfrage relevanten Daten 
nach dem Geschlecht, dem erreichten Lebensalter und dem Zeitpunkt des To- 
des. 

Für die Zeit davor und danach musste aber aus forschungsökonomischen 
Gründen auf aggregierte Daten und Statistiken zurückgegriffen werden. Dies be- 
deutete zunächst eine Verkürzung der Analyse um knapp 100 Jahre (statt 1579 
nun erst 1670 als Ausgangspunkt), weil die frühen Daten nur über eine eigene 
Datenaufnahme (Mikrodaten) erschließbar gewesen wären und weil statistische 
Auswertungen aus dieser Zeit vollständig fehlen. Man kann aber festhalten, 
dass sie prinzipiell erfassbar gewesen wären. Erst mit dem Jahr 1700 hätten da- 
gegen erste Abhandlungen mit aggregierten Daten zu den Verstorbenen zur 
Verfügung gestanden,’ die allerdings für die Forschungsanalyse auch nicht 
hinreichend genaue Angaben machten. Solche zusammenfassenden Angaben 
ließen sich zwar für die Zeit nach 1820 auf Grundlage der Kirchenbücher sowohl 
in Einzelstatistiken?' wie in zusammenfassenden Berichten? finden, sie bleiben 
aber lückenhaft und sind eben für viele Fragestellungen dann nicht wirklich 
passfähig, weil sie andere Fragestellungen verfolgten. 

Es ist diesen Jahrzehnten geschuldet, dass die Analyse nicht vergleichend 
für Frauen und Männer differenziert durchgeführt werden konnte, weil diese 
Geschlechtsspezifikation in den aggregierten Quellen fehlte. Überdies struktu- 
rierten diese Quellen die Altersgruppen erheblich vor, denn hier wurden zwar 
die Totgeburten, Säuglings- und Kindersterblichkeit angegeben, für die älteren 
Menschen erfolgte allerdings eine zusammenfassende Angabe, die lediglich die 
Gruppe der über 80-Jährigen heraushob, die mit der individuellen Altersangabe 
benannt wurden. 


30 Heinrich Ernst Güte, Angabe und Berechnung der Gebohrnen, Verstorbnen, Copulirten und 
Communicanten in den evangelisch=lutherischen Gemeinden der Stadt Halle und der damit ver- 
bundenen Amtsstädte vom Jahr 1701 bis 1800 (Halle, 1801). 

31 Stadtarchiv Halle, Neujahrszettel: 1801-1802, 1808, 1810-1811, 1814-1815, 1817-1853, A 
1.1.1, VA HA Kap. I, Abt. B, Nr. 11, Stadtarchiv Halle. 

32 Stadt Halle, Bevölkerungsstatistik. Bericht über die Verwaltung und den Stand der Gemein- 
de=Angelegenheiten der Stadt Halle a./S., Marienbibliothek Halle/Saale. 
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Abb. 1: Prozentuale Verteilung von Altersgruppen an der Sterblichkeit, 1670 bis 2018, Halle 
(Saale) (Grafik: Jakob und Katrin Moeller). 


Festhalten kann man aus diesen Beobachtungen vier systematische Aspekte: 

1. Nicht die in der Forschung immer wieder beschriebene Unterteilung in das 
„vorstatistische“ und „statistische“ Zeitalter machte den zeitlichen Ver- 
gleich schwierig, sondern der Bruch zwischen den genutzten Mikrodaten, 
die alle erforderlichen Informationen lieferten, und der Rückgriff auf die 
aggregierten Daten, die dies nicht in gleicher Weise oder auf einer direkt 
vergleichbaren Basis taten. Genau hier können Digital Humanities, breite 
Quellendigitalisierung (gerade von seriellen Quellen) oder digitales For- 
schungsdatenmanagement allein durch die Bereitstellung und Erschlie- 
Bung von bevorzugt Mikrodaten/Rohdaten (neben Analysedaten) wesentli- 
che Beiträge zur Forschung leisten, selbst wenn sie nicht unmittelbar zu 
wissenschaftlichen Analysen dienten. 

2. Der Bruch zwischen Mikro- und Makrodaten führt zu notwendig höheren 
Abstraktionsprozessen und ermöglicht nur eingeschränkte Kategorienbil- 
dungen. Dabei wurde nicht die Fragestellung verändert, wohl aber die 
Komplexität und Genauigkeit der Analyse (Verzicht der geschlechtsspezifi- 
schen Differenzierung, gröbere Alterskategorien). Es ist daher eine Aufgabe 
der digitalen Quellenkritik, Festlegungen oder Richtlinien zu entwickeln, in 
welchem Ausmaß solche Einschränkungen Akzeptanz finden, und so auch 
eine Verlässlichkeit für die Fachwissenschaft zu entwickeln. Dabei gilt na- 
türlich, dass bei jeder Kategorienbildung unvermeidlich höhere Abstrakti- 
onsprozesse enthalten sind. 


Die Modellierung des zeitlichen Vergleichs als Kernkompetenz —— 95 


3. Zur digitalen Quellenkritik gehört auch immer eine reflexive Überprüfung 
der Aussagekraft, Repräsentativität und des Wandels der Quellengrundla- 
ge. Beispielsweise verloren die Kirchenbücher im Verlauf des 19. Jahrhun- 
derts sukzessiv an Repräsentativität, weil Menschen zunehmend aufhörten, 
der Kirche anzugehören und hier eben auch nicht mehr erfasst wurden. 
Überdies ist bekannt, dass einzelne Bevölkerungsgruppen nie durch die 
kirchliche Registration erfasst wurden. Erst ab 1871 wurde dieser Schwund 
systematisch von der standesamtlichen Registrierung aufgefangen sowie 
durch weitere nunmehr sehr differenzierte statistische Dokumentationen 
ergänzt. Für die Stadt Halle/Saale wurde zwischen 1906/07 und 1950 ein 
statistisches Jahrbuch herausgegeben, dass vielfältige Einblicke in die De- 
mografie und Altersentwicklung erlaubt und das seit 2004 eine Neuauflage 
erhielt. Insgesamt gibt es im Verlauf des Untersuchungszeitraumes eine er- 
hebliche Veränderung des Einzugsbereiches. Wurde zu Beginn noch eine 
einzelne Kirchgemeinde erfasst, welche nur etwa die Hälfte der Bevölke- 
rung repräsentierte, war es im 19. Jahrhundert dann der gesamte Stadt- 
raum, der durch fortwährende Eingemeindungen schnell wuchs. Natürlich 
können solche Probleme statistisch mit formalen Methoden eingefangen 
werden, sie müssen in der geschichtswissenschaftlichen Praxis jedoch 
auch Akzeptanz finden. 

4. Wichtig erscheint noch ein Verweis auf die Zeit zwischen 1933 und 1945 so- 
wie auf die DDR. Nicht im vorstatistischen Zeitalter traten die größten 
Schwierigkeiten der Quelleninformation auf, sondern die größten methodi- 
schen Probleme bereitete die DDR-Zeit, in der zwar viele Daten erfasst, aber 
aufgrund der Geheimniswahrung häufig nicht publiziert wurden. Heraus- 
gegeben wurden nur die statistischen Jahrbücher für die gesamte DDR, ? 
bereits die Statistiken auf Bezirksebene” wurden nur für den Dienstge- 
brauch ausgewiesen, in den Zahlen auf Kreisebene” finden sich kaum dif- 
ferenzierte Angaben zur Bevölkerungsentwicklung. Quellen gerieten auf- 
grund der turbulenten Geschehnisse von Wende und Wiedervereinigung 
entweder gar nicht in Archive oder werden jetzt erst allmählich erschlos- 


33 Statistisches Jahrbuch der Deutschen Demokratischen Republik, hg. v. Staatliche Zentralver- 
waltung für Statistik (Berlin: VEB Deutscher Zentralverlag, 1955 (Jg. 1) bis 1991 (Jg. 35)). 

34 Statistisches Jahrbuch des Bezirkes Halle, hg. v. Staatliche Zentralverwaltung für Statistik, 
Bezirksstelle Halle (Halle: Statistisches Bezirksamt Halle, Bd. 1, Berichtsjahr 1963 (1964), letzter 
Bd. Berichtsjahr 1981 (1982)), vorhanden in der Sächsischen Staats- und Universitätsbibliothek, 
Bestand Y.8.997. 

35 Die wenigen Exemplare befinden sich ebenfalls im Dresdner Bestand Y.8.997. 
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sen.*° Im hier vorliegenden Datensatz wurden daher die Werte zum Durch- 
schnittsalter auf Grundlage des erreichten Lebensalters im Verhältnis zur 
hallischen Bevölkerung imputiert.” Für die neuesten Daten seit der Wie- 
dervereinigung bestand dann wieder das „Luxusproblem“, nicht über eine, 
sondern teilweise zwei oder mehr Datenreihen mit verschiedenen Zählwei- 
sen zu verfügen. Seit 1991 liegen sowohl die Daten des Landesamts für Sta- 
tistik wie der städtischen Verwaltung „Statistik und Wahlen“ vor. Gleich- 
zeitig unterliegen auch quantitative Daten dem Datenschutz. So dürfen An- 
gaben von weniger als fünf Personen nicht publiziert werden, weil diese 
trotz der Anonymisierung einen Rückschluss auf einzelne Personen erlau- 
ben würden, statistisch aber dennoch relevant sind. 


Auf Grund des Rückgriffs auf aggregierte Daten und von Geheimniswahrung 
oder heute Datenschutz sowie veränderten Erfassungsrichtlinien von Behörden 
in der heutigen Zeit führt dies fast zu mehr Analyseproblemen als die Zeit der 
Frühen Neuzeit, wo vorwiegend die Quellenerschließung geeigneter Ressourcen 
das eigentliche Hindernis bleibt, die heute mit Methoden der automatisierten 
Texterkennung aber aufgefangen werden könnten. 


Fragen der Vergleichbarkeit: Wie und was wird 
gemessen? 


Die grundlegendste Voraussetzung für die Verschneidung und Zusammenfüh- 
rung von Daten (und Big Data) ebenso wie für die Entwicklung von Wissensgra- 
phen, Normdaten oder für wissenschaftliche Analysen ist und bleibt jedoch ihre 
inhaltliche Passfähigkeit, die auf Ebene jeder einzelnen Variablen geklärt wer- 
den muss. Dabei werden heute häufig statistische Verfahren verwendet, ohne 
die Grundprinzipien der Reliabilität (Zuverlässigkeit) und Validität (Gültigkeit) 
in Massenquellen tatsächlich sicher abschätzen zu können. Dies gilt zum Teil 
auch, weil für qualitative und quantitative Datenanalysen variierende Prinzipi- 
en der Datenerhebung und Datenanalyse gelten, die in Mixed Methods-Ansät- 


36 André Steiner, „Die DDR-Statistik: Probleme und Besonderheiten,“ in Deutschland in Daten, 
hg. v. Rahlf, 15. 

37 Für den hier verwendeten Datensatz: LHASA, MER, Institut für Sozialhygiene und Organi- 
sation des Gesundheitsschutzes 1946-1991, M 527, Nr. 41, 43 und 45. Hier sind die Jahre 1976, 
1978 bis 1989 vorhanden. 
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zen nun jedoch wechselseitig integriert werden.” Ausschlaggebender dürfte je- 
doch sein, dass grundlegende Fragen zur Reliabilität und Validität in Verfahren 
des Distant Reading trotz aller Bemühungen um Fehlerraten für Massendaten 
gerade in Digital History-Projekten schwer abschätzbar bleiben.” Das Auffinden 
einer bestimmten Information etwa über Text Mining, als Beispiel soll hier der 
Terminus „Bäcker“ verwendet werden, lässt sich noch nicht sicher mit dem 
Kontext einer Zuordnung dieser Informationen zu einer bestimmten Entität (sta- 
tistisch: Variable, Kategorie) verorten. Gehört diese Angabe nun zu einem be- 
stimmten Beruf, wird gerade eine Person benannt oder war im Text damit ei- 
gentlich die Zunft der Bäcker (Organisation), das Viertel der Bäcker (Ort) oder 
etwas völlig anderes gemeint? Überdies sind die Fragen nach der Erfassung ei- 
ner fixierbaren Grundgesamtheit und der Klärung der Beobachtungseinheit, 
was bereits ganz basale Voraussetzungen für statistische Auswertungen bildet, 
häufig nicht sicher bestimmbar. Sowohl die statistische Auswertung noch mehr 
aber die fachliche Forschung im Rahmen von Digital History und Geschichts- 
wissenschaft bedarf daher vor allem einer auf inhaltlichen Entitäten beruhen- 
den Erkennung von Daten in ihrem Kontext, um eine differenzierte Quellenkri- 
tik überhaupt zu ermöglichen. Mittlerweile gibt es eine Vielzahl von Initiativen, 
die daran arbeiten, genau diese Herausforderung besser in den Griff zu bekom- 
men. 

Immerhin bieten gerade die in der historischen Forschung häufig genutzten 
seriellen Quellen, die etwa Angaben zu Alter und Beruf im langen Bogen thema- 
tisieren, den unschätzbaren Vorteil, eine Entitätserkennung wesentlich zu er- 
leichtern, weil sie diese Angaben bereits in der jeweiligen Zeit separiert nennen 
und über OCR- und HTR-Erkennungen dann auch relativ schnell erfassbar sind. 
Die Problematik der Messbarkeit von Begrifflichkeiten im Wandel der Zeit bleibt 
jedoch auch hier bestehen. 

Angesprochen wird damit die inhaltliche Konsistenz (was wird gemessen) 
ebenso wie die Frage der Methodik (wie wird gemessen), welche die grundle- 
gende Voraussetzung für die zeitliche Vergleichbarkeit schaffen. Problemszena- 
rien gibt es auch für die historische Forschung zahllose, einige davon illustriert 
auch Christopher Banditt in diesem Band mustergültig. Die Herausforderungen 
sind also hoch, die Möglichkeiten und Grenzen hierfür werden in Ausführungen 


38 Rainer Diaz-Bone, Udo Kelle und Jo Reichertz, „Zur Frage der Integration von qualitativer 
und quantitativer Forschung,“ in Qualitative Forschung, Analysen und Diskussionen — 10 Jahre 
Berliner Methodentreffen, hg. v. Günter Mey und Katja Mruck, 227-232 (Wiesbaden: Springer 
VS, 2014), doi: 10.1007/978-3-658-05538-7_12. 

39 Christian Fürber, Data Quality Management with Semantic Technologies (Wiesbaden: Sprin- 
ger Fachmedien Wiesbaden, 2016), doi: 10.1007/978-3-658-12225-6, 28-32; 74f. 
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zur Methodik der Geschichtswissenschaft jedoch weniger direkt angesprochen‘ 
oder in der Ausführung tatsächlich konkretisiert, weil diese Herangehensweisen 
besonders hermeneutische Dimensionen reflektieren.“ Dabei wird für Kategori- 
en wie das Alter oder andere mit naturwissenschaftlichen Prinzipien erfasste 
Entitäten häufig weit eher eine Möglichkeit zur Messbarkeit auch über eine lan- 
ge Zeitreihe unterstellt, als dies für qualitative Variablen wie etwa den Beruf der 
Fall ist. Dies liegt wie gezeigt jedoch weniger an der Quellensituation selbst, 
sondern vielmehr an fachlichen Verständigungsprozessen über eine spezifische 
Entität. 


Absolute Häufigkeit 


BE | a Pu Be a za De 
= 1 225 251 208 230 253) 269 286 191 34 


z. B. 9 Jahre 

Runde Zahl 169 333 365 449 451 532 375 201 30 
z. B. 10 Jahre 

- 1 141 248 188 199 227 241 272 103 16 
z. B. 11 Jahre 


Abb. 2: Altersangabe in Sterberegistern Halle (Saale), 1680 bis 1820 (Abbildung von Katrin 
Moeller) 


Denn natürlich bleibt auch die Information über das Alter einer Person in jeder 
historischen Quelle nur ein ungefährer Näherungswert. Sehr schön dokumen- 
tiert dies die in der Demografie bekannte Häufung von Altersnennungen: Für 
Gestorbene wurden in Halle/Saale im 18. Jahrhundert etwa doppelt so häufig 
die „runden“ Angaben gemacht, sie seien 20, 40 oder 60 Jahre alt geworden, 
statt „krumme“ Werte wie 21, 41 oder 61 Jahre zu nennen. Dabei war die Diffe- 
renz in den höheren Altersgruppen größer, während bei den jüngeren Men- 
schen aufgrund der zeitlichen Nähe offenbar noch ein spezifischeres Wissen be- 
stand. Natürlich gibt es auch hier ganz allgemeine Angaben die beschreibend 
auf das Phänomen der Zeit eingingen wie „Wochenkind“, „Alt“, „im besten Al- 
ter“ oder „Uralt“, für die diskutiert werden muss, ob sie in konkrete Alterskate- 
gorien eingeordnet werden können. Andererseits wurden selbst bei sehr alten 


40 Stefan Jordan, Theorien und Methoden der Geschichtswissenschaft. Orientierung Geschichte 
3104 (Paderborn: Ferdinand Schöningh, 2018). 

41 Rüdiger Graf, Zeit und Zeitkonzeptionen in der Zeitgeschichte, Version: 2.0, in: Docupedia- 
Zeitgeschichte, 22.10.2012, doi: 10.14765/zzf.dok.2.266.v2. 
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Menschen von den Pastoren noch liebevoll die durchlebten Wochen, Stunden 
und manchmal gar Minuten notiert, was ebenfalls mehr über die sozialen Bezie- 
hungen zu dieser Person aussagt als gegebenenfalls zum tatsächlichen Alter. 
Diese Quellenprobleme und Ungenauigkeiten, für die heute so vielfältige Be- 
trachtungen angestellt werden, sind letztlich für die eigentliche statistische 
Analyse allerdings gar nicht so erheblich, weil die Differenzierung der Katego- 
rien gar nicht diese Tiefenschärfe erreicht. 

Die Diskussion zur inhaltlichen Passfähigkeit des Alters könnte auch ent- 
lang der Chance/Differenz der erwartbaren Lebenszeit geführt werden, die über 
alle Altersgruppen in der Stadt Halle/Saale gerade mal bei 25 Jahren lag. Ent- 
spricht damit das heutige Lebensalter eines 80-Jährigen in der Frühen Neuzeit 
nicht eher dem Alter eines 25, 40, 50 oder 60-Jährigen? Die historische Demo- 
grafie hat sich gegen solche Analysemethoden entschieden. Dies liegt auch dar- 
in begründet, dass der zeitliche Wandel der Sterblichkeit immens war: Während 
heute die 82-jährige Frau im Durchschnitt am häufigsten verstirbt, war es im 18. 
Jahrhundert der männliche Säugling. Letztlich würde es die Analyse des zeitli- 
chen Wandels vielleicht verfälschen, wollte man also eigene Indikatoren entwi- 
ckeln, welche den Wandel bereits zum Gegenstand der Kategorisierung ma- 
chen. 

Natürlich lassen sich dabei nur Aussagen zum zeitlichen Wandel des tat- 
sächlich angegebenen Alters machen, nicht etwa zum gefühlten oder biologi- 
schen Alter, die in diesem Quellenbeispiel aufgrund der hier fehlenden Anga- 
ben nicht analysierbar sind. Insgesamt kann man nur immer wieder konstatie- 
ren, dass sich natürlich auch subjektive Wahrnehmungsformen und Prozesse in 
statistisch orientierte Kategorien bringen lassen, wenn denn Quellen dafür vor- 
liegen. Interessanter Weise ordnete aber auch die Gesellschaft des frühen 19. 
Jahrhunderts nicht — wie man eigentlich erwarten könnte - die 40, 50 oder 60- 
jährigen Menschen der herausgehobenen Gruppe der „Alten“ zu, sondern dieje- 
nigen, welche die Altersgrenze der 80 Jahre überschritten. Dies war letztlich 
auch für das hier vorgestellte Projekt die ausschlaggebende Begründung, war- 
um keine Methode zur Imputation differenzierter Altersgruppen entwickelt wur- 
de, sondern sich die Analyse an den inhaltlichen Festsetzungen der Quelle 
selbst orientierte und schließlich nur nach der Sterblichkeit von ganzen vier 
Gruppen von Kindern, Jugendlichen, Erwachsenen und Alten verglich. 

Was für das metrische Alter unberücksichtigt bleibt, wird für die qualitative 
Variable des Berufes mehr als genau unter die Lupe genommen, wie zahllose 
Diskussionen zeigen. Bereits weiter oben wurde die Berufsanalyse erwähnt, 
eine Variable, die sich neben dem Alter in der gleichen hier herangezogenen 
Quelle findet, wenn auch im 18. und 19. Jahrhundert noch unter der Bezeich- 
nung des „Berufsstandes“ geführt. Diese Bezeichnung umfasste, wie der 
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Abb. 3: Anteil der Altersgruppen an der Sterblichkeit in Prozent/Jahr, Halle/Saale: 1670 bis 
2018 (Grafik: Jakob und Katrin Moeller) 


heutige Berufsbegriff auch, neben den Aspekten der eigentlichen Erwerbstätig- 
keit auch sozialkulturelle Aspekte wie etwa Elemente der (religiös geprägten) 
Lebensführung.“ Kann diese Entität des Berufsstandes nun für den Vergleich 
von Berufsangaben dienen, die heute mit spezifischen normativen Konzepten 
eines mit fachlicher Ausbildung und Zertifizierung verknüpften Erwerbsberufes 
versehen sind? Während moderne Soziologie und Wirtschaftswissenschaft in- 
ternational Berufe seit über 100 Jahren kategorisieren und vergleichen, und da- 
bei natürlich auch den äthiopischen Injeraproduzenten“? mit Berufen in einer 
hochmechanisierten, europäischen Großbäckerei vergleichen kann, lautete die 
Antwort der federführenden Kompetenz der DFG-Kommission Geschichtswis- 
senschaft abschlägig: Der Berufsstand der Frühen Neuzeit und der moderne Er- 
werbsberuf im 20. Jahrhundert seien unvergleichbar, konstatiert dieses Gremi- 
um, das damit auch inhaltlich über Entitätsrekonstruktionen und Entwicklun- 
gen von Digital History entscheidet. Damit argumentierte die Kommission ganz 
analog der Ausgestaltung einer arbeitsorientierten geschichtswissenschaftli- 
chen Forschungslandschaft, die mittlerweile zu relativ separierten Forschungen 


42 Katrin Moeller, „Stand oder Beruf? Arbeitsspezifische und religiöse Konzepte von Beruf und 
Leistung im 18. Jahrhundert,“ in Industrielle Arbeitsbeziehungen in Mitteldeutschland: Zwischen 
Klassenkampf, Sozialpartnerschaft und Betriebsgemeinschaft (1815-2015), hg. v. Michael Schä- 
fer, Swen Steinberg und Veronique Töpel (Leipzig: Leipziger Universitätsverlag, 2018), 27-48. 
43 Injera ist ein Fladenbrot aus Teff. 
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einerseits zur ständischen Gesellschaft und andererseits zur industriellen Be- 
rufsgesellschaft geführt hat. Für letztere arbeitete die Zunft in der jüngeren Ver- 
gangenheit vor allem die normative Fixierung der Arbeit durch die reichsweite 
Sozialgesetzgebung sowie den Patent- und Urheberschutz als prägendes Merk- 
mal der modernen Arbeit heraus, welche durch das Prinzip der sozialen Platzie- 
rung durch Arbeitsleistungen und die darauf aufbauende Ökonomisierung des 
gesamten Lebens sowie die Entwicklung der (spezifisch deutschen) Ausbil- 
dungsberufe im 20. Jahrhundert als Zäsur setzende Merkmale ergänzt werden.” 
Damit wird für das 19./20. Jahrhundert eine einzigartige Berufsgesellschaft kon- 
statiert, die heute bereits im Zerfall begriffen ist. Die Frage ist nur, in welchem 
Verhältnis dazu die Erwerbsarbeit der Frühen Neuzeit steht, die letztlich durch 
ähnliche Merkmale von beruflichen Tätigkeitsfeldern und Anforderungsniveaus 
definiert ist, auch wenn die Rahmenbedingungen von Normen und sozialer Plat- 
zierung selbstverständlich andere waren. Gleiches könnte analog dazu aller- 
dings auch für das Sterbealter in Anspruch genommen werden, wie ja allein die 
heute völlig andere Altersstruktur und das Sterbealter dokumentieren. Natürlich 
waren die Wohn- und Lebensbedingungen, die Hygiene, die Mittel der Gesund- 
heitserhaltung durch die Medizin in der Frühen Neuzeit gänzlich andere als heu- 
te. Kann man daher das Lebensalter einst und jetzt nicht vergleichen? Oder wird 
hier nicht eher das Ergebnis des Vergleichs mit der Methode verwechselt? 

Die Ablehnung einer Vergleichbarkeit von vormodernen und modernen Be- 
rufen speist sich letztlich auch aus den früheren Diskussionen der Überinterpre- 
tation des Berufsbegriffes in der früheren Forschung. Besonders die Schlussfol- 
gerung von Sozialhierarchien aus reinen Berufsangaben führte zu falschen 
Schlussfolgerungen beziehungsweise Überinterpretationen, wie in den 1990er 
Jahren durchaus zu Recht kritisiert wurde. 

Gleichzeitig führte noch eine zweite methodische Unschärfe zu dieser Ab- 
lehnung: Der Beruf wird nicht als spezifische Entität mit einer Eigenschaft ge- 
messen oder interpretiert, sondern als komplexer analytischer Begriff im Kon- 
text seiner vielfältigen Rahmenbedingungen, wie dies in der hermeneutischen 
Interpretation wahrgenommen wird. Wie bereits für die Zeit herausgearbeitet, 
folgt die informatische Modellierung und statistische Analyse strikt den Regeln 
einer Entitätsbildung, die sich auf einzelne Eigenschaften komplexer Begriff- 
lichkeiten orientiert (ER-Modell). Im Fall des Berufes ist dies vor allem die Tätig- 
keit beziehungsweise das Tätigkeitskonzept, welche über die bloße Berufsbe- 
zeichnung wie sie uns in der Masse der historischen Quellen entgegentritt, 


44 Hier sei stellvertretend für eine sehr ausdifferenzierte Forschungslandschaft nur auf einen 
viele Aspekte bündelnden Tagungsband verwiesen: Geschichte und Zukunft der Arbeit, hg. v. 
Jürgen Kocka und Claus Offe (Frankfurt a. M.: Campus-Verlag, 2000). 
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überwiegend ermittelbar ist. In diesem Fall der Operationalisierung geht es also 
nicht, wie häufig unterstellt, um die soziale Hierarchie einer Gesellschaft oder 
die ständische Platzierung, nicht um bestimmte Ausbildungskonzepte oder die 
normative Verankerung eines Berufes. Diese Kategorien bedürften anderer 
Quellen, um sie zu messen. In einer Gesamtanalyse können sie aber natürlich 
wieder zu komplexeren Methoden zusammenfließen. Letztlich geht es bei der 
Berufsnennung, wie sie uns in vielen Quellen entgegentritt, eben um einen be- 
stimmten Stand, der mit einer mehr oder weniger präzise beschreibbaren Tätig- 
keit zusammenfällt. 

In Hinblick auf das Tätigkeitskonzept ist es daher doch weniger relevant, 
ob der Bäckerlehrling der Frühen Neuzeit seine Lossprechung vor einer örtli- 
chen Zunft und unter Regelungen lokaler normativer Regelungen fand, wäh- 
rend er dies heute im besten Fall unter dem Eindruck deutschlandweiter Rege- 
lung tut und morgen vielleicht unter EU-Normen. Dies wäre bevorzugt für 
bildungsbasierte Skalen und Messungen wichtig. Es hat für die Tätigkeitsbe- 
schreibung auch weniger Relevanz, ob der Arbeitnehmer für seine Arbeit eine 
Altersabsicherung über individuelle, betriebs- oder gesellschaftsorganisierte 
Formen erhält oder ob er den Beruf frei wählen konnte. In der modernen Berufs- 
forschung kennt man mehr als 25 verschiedene Klassifikationsansätze für ganz 
verschiedene Eigenschaften des Berufes.“ Der am Historischen Datenzentrum 
Sachsen-Anhalt entwickelte Klassifikationsansatz der „Ontologie der histori- 
schen, deutschsprachigen Amts- und Berufsbezeichnungen“ schließt an inter- 
nationale Standards zur Berufsklassifikation wie ISCO, HISCO in seiner deutsch- 
sprachigen Ausformung der Klassifikation der Berufe 2010 an und nimmt Tätig- 
keitsprofile und Kompetenzen in den Blick. Das heißt, ausgehend von den 
Überschneidungen oder Ähnlichkeiten einzelner Kompetenzen, Tätigkeiten und 
Anforderungsniveaus, hat man die einzelnen Berufsgruppen zusammengefasst. 

Zentral sind dagegen Fragen, die sich tatsächlich auf die Tätigkeit und ihre 
Eigenschaften beziehen: Gehört der Bäcker der Frühen Neuzeit, der sein Brot 
mit der Hand knetete, in die gleiche Kategorie wie der heutige Bäcker, der die 
Maschinen dazu bedient? Moderne Klassifikationen gehen, wie oben geschildert 
davon aus, weil Tätigkeiten hier in einem Gesamtspektrum beruflicher Tätigkeit 
betrachtet werden. 

Eine wichtige Frage für Digital History ist also: Wie viel Differenzierung ist 
für - vornehmlich standardisierte und für automatisierbare - Kategorienbil- 
dung von Massendaten notwendig, um zu einem guten Vergleich mit statisti- 


45 Forschungsdaten des BIBB-FDZ zu administrativen und nicht-administrativen Klassifikatio- 
nen, in FDZ Metadatenportal, hg. v. Bundesinstitut für Berufsbildung (Bonn 2019), https://meta 
daten.bibb.de/klassifikationenIndex. Zugriff am 19.02.2022. 
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schen Mitteln und zur Akzeptanz im eigenen Fach zu kommen? In Hinblick auf 
die hier vorgestellten Beispiele wurde sichtbar, dass es sich kaum lohnt, hier 
überbordend hohe Barrieren mit einem unermesslichen Aufwand zu fixieren, 
was besonders für die Langzeitperspektive gilt. Die heute in Deutschland ange- 
wandte Klassifikation von Berufen im internationalen Standard (Klassifikation 
der Berufe 2010/20) kennt in ihrer minimalen Kategorienbildung zehn Berufs- 
hauptgruppen, und davon ausgehend differenzieren sie sich in ihrer maximalen 
Beschreibungsform in 1.286 Berufsuntergruppen.”° Sie basiert auf einem rudi- 
mentären Konzept von verschiedenen Kompetenzen, Produkten und Sprachen, 
die eben selbst dem Unterschied zwischen manueller Tätigkeit des Backens und 
dem Bedienen von komplexen Backautomaten noch relativ wenig Bedeutung 
geben. Sie setzt aber sehr granulare Berufsnamen zur Klassifikation an, um Ein- 
ordnungen transparent und nach Bedürfnis auch änderbar auszugestalten. Sol- 
che Beispiele können für uns handlungsleitend sein, um gute Vokabulare oder 
gar Standards zu entwickeln, die zudem tatsächlich einer Analyse von Zeitdi- 
mensionen unmittelbar zugutekommen, gleichzeitig aber überhaupt effektiv 
einsetzbar und flexibel bleiben. Bei den Berufsbezeichnungen wird zudem 
schnell klar, dass sich verändernde Berufskonzepte häufig auch veränderte Be- 
grifflichkeiten nach sich zogen. Allein diese Analyse kann also Wandlungspro- 
zesse in den Blick nehmen, wenn sie auch auf das Original und die Quelle zu- 
rückverweist und diese transparent sichtbar macht. 


Zusammenfassung 


Die Thematik des zeitlichen Vergleichs ist für Digital History und weit darüber 
hinaus für ein interdisziplinäres, datenbasiertes Forschungsfeld innovativ nutz- 
bar. Über das Anwachsen von Datenbeständen werden Verfahren und Metho- 
den der Langzeitanalyse möglich, für die Geschichtsforschung viele Kompeten- 
zen mitbringt und diese systematisch ausbauen kann. 

Wie argumentiert, wird das Ergebnis hermeneutischer Methoden des zeitli- 
chen Vergleichs weitgehend in der Analyse des Wandels oder des Bruchs darge- 
stellt, während die Gemeinsamkeiten fast unkommentiert „verschwinden“. Die 
grundsätzliche Verankerung des Vergleichs als Methode der Differenz und Über- 
einstimmung, wie sie bereits von John Stuart Mill 1843 skizziert wurde, hat sich 


46 Klassifikation der Berufe 2010 (KldB 2010) (Nürnberg, 2011). https://statistik.arbeitsagentur. 
de/DE/Navigation/Grundlagen/Klassifikationen/Klassifikation-der-Berufe/KldB2010-Fas 
sung2020/KldB2010-Fassung2020-Nav.html. Zugriff am 19.02.2022. 


104 —— Katrin Moeller 


in der hermeneutischen Praxis nicht gleichermaßen durchgesetzt.” Dies gelingt 
durch die formale Modellierung von zeitbezogenen Daten mithilfe definierter Ei- 
genschaften von Entitäten. Die Modellierung zeitbezogener Daten verspricht 
also einen auf das eigene Fach bezogenen Mehrwert, wie Rehbein dies als wich- 
tiges Kriterium für digitale Forschung gefordert hat. Während hermeneutische 
Forschung zudem eine komplexe Einbettung ermöglicht, ist dies bei der Model- 
lierung von Daten der umgekehrte Fall. 

Notwendig und wichtig sind jedoch Verständigungen über methodische Lö- 
sungskonzepte zur Abstraktion von Kategorien, zum Umgang mit Imputations- 
verfahren und ihre Weiterentwicklung sowie zu Forschungen zum genauen Be- 
griffswandel und seiner Modellierung. 
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Leif Scheuermann 

Uber die Rolle computerbasierter 
Modellrechnungen und Simulationen fiir 
eine digitale Geschichte 


Abstract: The following article addresses the significance of simulations and 
model calculations for a digital history. In a first section, the term digital history 
is questioned in order to arrive at a general definition of digital history as an 
algorithmically composed approach to the past and algorithmic modeling of 
systems for the description and exploration of historical processes and states. A 
second section includes a definition of simulation and model computation as 
virtual attempts to recreate processes or states with the goal of modeling and 
testing complex systems. Both areas (digital history and simulation/model com- 
putation) are brought together in a concluding third section, with specific atten- 
tion to the source value and limitations of simulations and model computations 
of historical processes and states. 


Keywords: simulation, modelling, model calculation 


Zusammenfassung: Der folgende Beitrag thematisiert die Bedeutung von Simu- 
lationen und Modellrechnungen fiir eine digitale Geschichte. Hierfiir wird in ei- 
nem ersten Abschnitt der Begriff Digital History hinterfragt, um letztlich zu ei- 
ner allgemeinen Definition der digitalen Geschichte als algorithmisch verfasster 
Annäherung an die Vergangenheit und algorithmische Modellierung von Syste- 
men zur Beschreibung und Exploration historischer Abläufe und Zustände zu 
gelangen. Ein zweiter Abschnitt beinhaltet eine Begriffsbestimmung von Simu- 
lation und Modellrechnung als virtuelle Versuche zur Nachbildung von Prozes- 
sen oder Zuständen mit der Zielsetzung der Modellierung und Erprobung kom- 
plexer Systeme. Beide Bereiche (Digital History und Simulation/Modellrech- 
nung) werden in einem abschließenden dritten Abschnitt zusammengeführt, 
wobei ein spezifisches Augenmerk auf dem Quellenwert und den Grenzen von 
Simulationen und Modellrechnungen historischer Prozesse und Zustände gelegt 
wird. 


Schlagwörter: Simulation, Modellierung, Modellrechnung 
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1 Digitale Geschichte - eine Begriffsbestimmung 


Der Begriff Digital History erlangt nicht erst in Zeiten einer durch den grassie- 
renden Corona-Virus bedingten räumlichen Einschränkung unserer Gesellschaft 
zunehmend an Bedeutung im internationalen Wissenschaftsbetrieb. Dabei ist 
die Beschäftigung der Historiker:innen mit den Neuen Medien ebenso wenig 
neu,! wie das Aufzeigen der Probleme und Risiken einer nicht hinterfragten 
Nutzung.? 

Mit dem Aufkommen der ‚Digital Humanities‘ im deutschsprachigen Raum 
in den 2010er Jahren verschob sich allerdings der Fokus der Aufmerksamkeit zu 
Gunsten der Computerphilologie und Computerlinguistik, so dass die Übernah- 
me der englischen Benennung und der Anfangsbuchstaben (welche regelmäßig 
zu Verwirrungen führt) als Gegenbewegung zum Anspruch einer generalisier- 
ten, die gesamten Geisteswissenschaften umfassenden Herangehensweise zu 
verstehen ist.’ 

Betrachtet man den Begriff der Digital History unabhängig von seiner histo- 
rischen Genese, so stellt sich die Frage, was unter dem selbst im Alltagsleben 
omnipräsenten „digital“ zu verstehen ist. Bei einer näheren Betrachtung zeigt 
sich, dass es schwer fällt, den allgemein akzeptierten Begriff klar zu definieren.* 


1 Hier sind an erster Stelle die Arbeiten von Manfred Thaller seit dem Ende der 1970er Jahre 
und damit eng verbunden die Forschungsgruppe am Max-Planck-Institut für Geschichte in Göt- 
tingen zu nennen. Zudem sei daran erinnert, dass bereits seit 1993 die Arbeitsgemeinschaft 
EDV und Geschichte (AGE) unter anderem mit einer Publikationsreihe sowie jährlichen Tagun- 
gen sich für die „Förderung des EDV-Einsatzes als Mittel der Forschung und Lehre in den Ge- 
schichtswissenschaften einsetzt“ (Homepage Arbeitsgemeinschaft Geschichte und EDV e.V., 
„Homepage“. https://www.age-net.de/. Zugriff am 26.04.2021. Siehe hierzu: Arbeitsgemein- 
schaft Geschichte und EDV, 20 Jahre Arbeitsgemeinschaft Geschichte und EDV, hg. v. Jörn Ko- 
bes, Kai Ruffing und Wolfgang Spickermann (Gutenberg: Computus-Druck Satz & Verlag 2013); 
Patrick Reinard, „Zur Wirkungsgeschichte der AGE und der Reihe ‚Abhandlungen der Arbeits- 
gemeinschaft Geschichte und EDV‘ (AAGE),“ in Funktion und Aufgabe digitaler Medien in Ge- 
schichtswissenschaft und Geschichtsunterricht, hg. v. Krešimir Matijević, (Gutenberg: Computus 
Druck Satz & Verlag, 2020), 11-15. 

2 In einem bis heute zentralen Aufsatz mit dem Titel „Die Geschichte: Wissenschaft und Fik- 
tion“ zeigte Michel de Certeau (Reprint 2019, 61-95, bes. 72-82) bereits in den 1980er Jahren 
die zentralen Problematiken einer sich durch die vermeintliche Faktizität moderner Datenver- 
arbeitung legitimierenden Historiographie. 

3 Zur Frage einer Abgrenzung der Digitalen Geisteswissenschaften jenseits einer auf adminis- 
trativen Grenzen begründeten Bestimmung des Faches siehe: Leif Scheuermann, „Die Abgren- 
zung der digitalen Geisteswissenschaften.“ Digital Classics 2/1 (2016). doi: 10.11588/ 
dco.2016.1.22746. 

4 So findet man im Duden beispielsweise unter Digital neben einem Verweis auf die Handchir- 
urgie die selbstbezügliche Bestimmung „Digitalverfahren betreffend“. Dudenredaktion, „Digi- 
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Um dieses Phänomen der Vagheit des Begriffs zu fassen, hilft es, Ernesto Lauc- 
laus Überlegungen zur Rolle „Leerer Signifikanten“ heranzuziehen.’ Der argen- 
tinische Poststrukturalist sieht in dem Vakuum, das ein Bezeichner ohne be- 
zeichneten Inhalt schafft, einen Leerraum, der für die Vereinigung unterschied- 
lichster oft auch divergenter Interessen mit hegemonialem Anspruch 
prädestiniert ist. Zudem, so Laclau, führt die Leere als Gegensatz zu allem Be- 
stehenden dazu, dass das Bezeichnete etwas gänzlich Anderes, radikal Neues 
darstellen muss, für welches es sich lohnt, zu kämpfen. Der leere Signifikant 
wird so zum Politikum und zum Kampfbegriff gegen das Bestehende. Exakt dies 
zeigt sich in der inflationären Benutzung des Begriffs „digital“ in den 6ffentli- 
chen Diskursen generell und speziell im Ringen der Historiker:innen um die be- 
grenzten Drittmittelgelder. 

Doch so erhellend und einleuchtend diese Erklärung des Phänomens des 
Digitalen erscheint, so wenig hilft sie für eine inhaltliche Bestimmung des Be- 
griffs einer digitalen Geschichte. Es gilt also, einen anderen Weg einzuschlagen, 
weshalb im Folgenden eine Definition von „digital“ entgegensetzen werden 
soll, die mit Max Eyth® und in Nachfolge Georg Simmel’ folgendermaßen formu- 
liert werden kann: Digital ist alles, was dem menschlichen Wollen eine algorith- 
mische Form gibt.® 

Der Kern des Digitalen, so der hier vorgestellte Ansatz, ist der Algorithmus 
im Sinne Alan Turings als vollständige und eindeutige Handlungsanweisung 
zur Lösung eines Problems in endlich vielen Schritten. Aus dieser Definition er- 
geben sich nun weitere Bestimmungen, die gerade im Hinblick auf eine digitale 
Geschichte zentral sind. Ein Algorithmus beschreibt immer einen Prozess. Er ist 
ephemer - eine Anleitung, ein Ablauf, aber kein Ergebnis oder Gegenstand. Er 
muss vollständig und eindeutig definiert sowie endlich sein. Zudem müssen die 


tal auf Duden online“. https://www.duden.de/node/134370/revision/134406. Zugriff am 
26.04.2021. 

5 Ernesto Laclau, Emanzipation und Differenz, 2., unveränd. Aufl., Nachdr (Wien: Turia + Kant, 
2007). 

6 Max Eyth, „Poesie und Technik,“ in Lebendige Kräfte, hg. v. Max Eyth (Berlin, Heidelberg: 
Springer Berlin Heidelberg, 1908), 1. 

7 Ernst Cassirer, „Form und Technik (1930),“ in Aufsätze und kleine Schriften (1927-1931), 
hg. v. Tobias Berben, (Hamburg: Meiner, 2004), 139-183. 

8 Eyth fährt fort: „Und da das menschliche Wollen mit dem menschlichen Geist fast zusam- 
menfällt, und dieser eine Unendlichkeit von Lebensäußerungen und Lebensmöglichkeiten ein- 
schließt, so hat auch die Technik trotz seines Gebundenseins an die stoffliche Welt, etwas von 
der Grenzenlosigkeit des reinen Geisteslebens überkommen“ (Eyth, Poesie und Technik, 1-2.). 
Überträgt man dies auf das Prozedurale und damit Unstoffliche des Algorithmus, so werden die 
überspitzten Träume und inhärenten Allmachtsphantasien, die mit einer vermeintlichen Digi- 
talisierung der Welt einhergehen, umso verständlicher. 
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gleichen Bedingungen stets die gleichen Ergebnisse zeitigen und damit korrelie- 
rend, müssen zum Zeitpunkt ihrer Ausführung die einzelnen Handlungsschritte 
eindeutig definiert sein.? 

Was bedeuten diese Konkretisierungen nun für die Möglichkeit einer digita- 
len Geschichte? Geht man nicht von einer eschatologischen Geschichtsphiloso- 
phie aus, ist eindeutig ersichtlich, dass der Ansatz, die Vergangenheit selbst als 
Algorithmus zu fassen oder zu verstehen, abzulehnen ist, da weder das System 
eindeutig bestimmt werden kann, noch Anforderungen der Determiniertheit, 
des Determinismus oder der Endlichkeit erfüllt sind. Dementsprechend ist es 
wenig verwunderlich, dass große Teile der bestehenden EDV-Nutzung in den 
Historischen Wissenschaften in der digitalen Zurverfügungstellung von Quellen 
oder Abhandlungen, der Erstellung digitaler Werkzeuge für die Analyse und 
nicht zuletzt in der digitalen Vermittlung für eine breite Öffentlichkeit bestehen. 
Dies ist zweifelsohne ein zentraler Bestandteil der Hilfswissenschaft „digitale 
Geschichte“ und wird sicher auch weiterhin ein wesentlicher Bestandteil der 
Teildisziplin bleiben. Doch ist es nicht zu verleugnen, dass es sich hier um eine 
„Digital aided History“- also eine digital unterstützte Geschichte — handelt.'° 

Betrachtet man hingegen Geschichte als hermeneutische Annäherung an 
die Vergangenheit, als Modell und Übersetzung in die Gegenwart, so ist folge- 
richtig digitale Geschichte als algorithmische Annäherung an die Vergangen- 
heit zu verstehen, als die algorithmische Modellierung von Systemen zur Be- 
schreibung und Exploration historischer Abläufe und Zustände. Genau dies ist 
der Inhalt von Simulationen und Modellrechnungen. 


2 Simulation und Modellrechnung 


Spätestens mit der rasanten Zunahme der Leistungsfähigkeit von Prozessoren 
in den letzten 30 Jahren ist die computerbasierte Simulation komplexer Systeme 
in den Natur- und Technikwissenschaften zu einem zentralen Element der For- 
schung geworden." Das Spektrum reicht hierbei von medizinischen Simulatio- 
nen (zum Beispiel der Ausbreitung von Pandemien oder des Ablaufs komplizier- 
ter Operationen) über die Kerntechnik bis hin zur Meteorologie oder der Ver- 


9 Einführend Thomas H. Cormen und Paul Molitor, Algorithmen - eine Einführung, 3., überarb. 
und erw. Aufl. (München: Oldenbourg, 2010). 

10 Scheuermann, „Abgrenzung“. 

11 Siehe hierzu unter anderem Wissenschaftsrat, „Bedeutung und Weiterentwicklung von Simu- 
lation in der Wissenschaft.“ (2014), Positionspapier (Drs. 4032-14), Juli 2014 https://www.wis 
senschaftsrat.de/download/archiv/4032-14.html, Zugriff am 20.02.2022. 
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kehrstechnik. In den Geschichtswissenschaften hingegen sind Simulationen bis 
dato nur in Ansätzen vertreten.” Ein Grund mag sein, dass die Kenntnis vom 
Nutzen, aber auch von den Grenzen des Ansatzes in Historiker:innenkreisen 
noch unterrepräsentiert ist.” Um hier Abhilfe zu schaffen, erscheint eine klare 
Definition der Thematik notwendig: 


Eine Simulation ist ein im naturwissenschaftlichen Paradigma verfasstes virtuelles, repro- 
duzierbares Experiment zur Nachbildung eines Prozesses oder Zustands. Zielsetzung ist 
die Modellierung und Erprobung komplexer Systeme für die Gewinnung eines besseren 
Verständnisses von Abläufen und Wertigkeiten einzelner Faktoren sowie möglichst reali- 
tätsnaher Vorhersagen bzw. starker Eingrenzungen der naturwissenschaftlich möglichen 
Zukünfte (Möglichkeitsraum).'* 


Bei Simulationen handelt es sich also um virtuelle naturwissenschaftliche Expe- 
rimente, was wiederum eine klare Hypothese und eine wohldefinierte Versuchs- 
anordnung impliziert. Simulationen kommen zum Einsatz, wenn ein realweltli- 
ches Experiment zu teuer oder gefährlich ist, der Untersuchungsgegenstand 


12 Für die Alte Geschichte sind hier besonders die Arbeiten von Peter Scholz (Stuttgart) im 
Kontext des interdisziplinären Forscherverbunds „Reden ohne Mikrophon“, https://www.hi. 
uni-stuttgart.de/ag/forschung/rom/ Zugriff am 11.01.2021 zu nennen sowie die Forschungen 
des Teams um Christoph Schäfer (Trier) zu Schifffahrt in der Antike. Einführend: Rudolf Aß- 
kamp und Christoph Schäfer, „Projekt Römerschiff: Nachbau und Erprobung für die Ausstel- 
lung ‚Imperium, Konflikt, Mythos - 2000 Jahre Varusschlacht,‘“ in 2000 Jahre Varus- 
schlacht. Imperium — Konflikt - Mythos, hg. v. LWL Römermuseum, Landesverband Lippe 
und VARUSSCHLACHT im Osnabrücker Land GmbH - Museum und Park Kalkriese (Stuttgart: 
Theiss, 2009); Christoph Schäfer, „Experimentelle Archäologie trifft auf Schifffahrt: Ein römi- 
scher Prahm im Test.“ Antike Welt 5 (2017): 76-83. Besonders zu erwähnen ist hierbei die her- 
ausragende Dissertation von Pascal Warnking, in welcher er den Nutzen moderner Regatta- 
Navigationssoftware für die Alte Geschichte nachweist [Pascal Warnking, „Roman Trade Rou- 
tes in the Mediterranean Sea: Modelling the routes and duration of ancient travel with modern 
offshore regatta software,“ in Connecting the Ancient World: Mediterranean Shipping, Maritime 
Networks and their Impact, hg. von Christoph Schäfer. 1. Auflage (Rahden/Westf.: Verl. Marie 
Leidorf, 2016), 40-90]. Für eine detailliertere Untersuchung bestehender Ansätze siehe: Leif 
Scheuermann (Hg.), Simulation von Handel und Verkehr in Kriegs- und Friedenszeiten der Antike 
(Heidelberg: Propylaeum, 2020). 

13 So kritisiert Annette Vowinckel bereits 2009 die weit verbreitete, doch unzutreffende An- 
sicht, dass Geschichte und Simulation sich ausschließen würden: „History seems to be the only 
academic discipline which successfully avoids to discuss the impact of simulation on processes 
of gaining knowledge, even if at the same time non-scientific simulations of history — especi- 
ally in computer games - have become very popular.“ [Annette Vowinckel, „Past Futures: 
From Reenactment to the Simulation of History in Computer Games.“ Historical Research/His- 
torische Sozialforschung 34/2 (2009): 322-332]. Leider hat sich an dieser Aussage bis dato wenig 
geändert. 

14 Scheuermann, Simulation, 9. 
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noch nicht oder nicht mehr existiert, der Untersuchungsgegenstand zu groß 
oder zu klein ist, Prozesse zu schnell oder zu langsam ablaufen oder die Struk- 
turen des betrachteten Systems zu komplex oder noch nicht verstanden sind, 
wobei hier oft ein spezifisches Augenmerk auf der Exploration der Zusammen- 
hänge verschiedener Parameter liegt. Ziel ist es dabei, den Einfluss einer be- 
grenzten Menge an einzelnen das Gesamtsystem hinreichend abbildenden Fak- 
toren zu isolieren und - nach Etablierung des Systems — Vorhersagen unter An- 
nahme des naturwissenschaftlichen Paradigmas der Reproduzierbarkeit treffen 
zu können. Dies heißt letztlich nicht weniger, als dass ein Experiment mit glei- 
chen Voraussetzungen stets gleiche Ergebnisse erzielt. Dabei bilden begleitende 
realweltliche Experimente die Basis, auf der das System validiert und schritt- 
weise hin zu einer realweltlichen Evidenz adaptiert wird. 

Zum Aufbau eines Simulationssystems (Abbildung 1) bedarf es einer Frage- 
stellung, anhand welcher ein abstraktes Modell eines Ausschnitts der Realität 
erarbeitet wird. Dieses definiert die Eingangsdaten und die Algorithmen, welche 
in einem weiteren Schritt numerisch ausformuliert werden. Programm und Ein- 
gangsdaten werden in der Simulationsrechnung zusammengeführt und ergeben 
erste Simulationsergebnisse, welche (wie bereits gesagt) mit realweltlichen 
Benchmarkdaten abgeglichen werden. Diese Validierung führt zu einer Verfei- 
nerung der Modellierung, bis eine hinreichende Deckungsgleichheit erreicht ist. 

Am Schluss des Prozesses steht ein System, das den Anspruch erhebt, das 
Phänomen weitestgehend abbilden zu können, sodass es auf andere Szenarien 
angewandt werden kann. 

Im Gegensatz zur Simulation sollen unter dem Begriff „Modellrechnung“ 
alle algorithmisch verfassten Modelle subsumiert werden, die nicht den stren- 
gen Richtlinien eines naturwissenschaftlichen Experiments unterliegen, da sie 
vom menschlichen Handeln abhängig sind oder dieses zu beschreiben versu- 
chen. Der Ablauf einer Modellrechnung entspricht dabei weitestgehend dem 
der Simulation. Als zeitgenössisches Beispiel sind hier Wahlprognosen zu nen- 
nen. Diese basieren auf fundierten und statistisch abgesicherten Befragungen 
und bilden meist die Stimmungslage vor einer Wahl mit sehr hoher Genauigkeit 
ab. Als Benchmarkdaten zur Validierung der Rechnungen fungieren die erziel- 
ten Wahlergebnisse, wobei die Unschärfen in diesem Prozess weitaus größer 
sind als bei Simulationen. Grund hierfür ist, dass die tatsächlichen Entschei- 
dungen der einzelnen Wähler:innen nicht durch Modellrechnungen ermittelt 
werden können, da diese von einer Vielzahl unterschiedlichster, oft nicht klar 
festzumachender Faktoren und schließlich der spontanen freien Entscheidung 
der Akteurin oder des Akteurs abhängen. Dennoch liegt der Wert einer solchen 
Prognose wie auch der algorithmischen Annäherung an den Entscheidungspro- 
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zess auf der Hand, ohne dass es sich im strengen Sinne um eine Simulation 


handelt. 
Ausschnitt der 
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Abb. 1: Diagrammatische Darstellung des Aufbaus eines Simulationssystems. Abbildung von 
Leif Scheuermann. 
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3 Simulationen und Modellrechnungen als 
inhärenter Bestandteil einer digitalen 
Geschichte für die Historischen Wissen- 
schaften? 


Die ersten beiden Abschnitte dieses Beitrags beinhalteten Bestimmungen der 
Begriffe Digital History sowie Simulation und Modellrechnung. Es konnte bis 
hier gezeigt werden, dass Modellrechnungen und Simulationen einen inhären- 
ten Bestandteil einer digitalen Geschichte ausmachen. In einem letzten Schritt 
werden im Folgenden nun beide Bereiche zusammengeführt, um Chancen und 
Grenzen eines solchen Vorgehens aufzuzeigen. 

Die Sinnhaftigkeit von Modellrechnungen für die Historischen Wissenschaf- 
ten erscheint bereits auf den ersten Blick als evident. Es können historische Mo- 
delle in algorithmischer Form formuliert, virtuell erprobt und anhand histori- 
scher Quellen validiert werden. So kann das Verständnis vom Einfluss der ein- 
zelnen Faktoren verfeinert und nicht haltbare Theorien verworfen werden. 
Idealtypische Einsatzbereiche sind hier die Wirtschaftsgeschichte, aber auch 
die historische Demographie. Weitaus problematischer ist hingegen der Ver- 
such, nicht existente historische Quellen (zum Beispiel Geburtenraten oder die 
nicht dokumentierte Nutzung von Verkehrswegen) anhand von Modellrechnun- 
gen zu erfassen. 

Dies wiederum ist im Kontext der Simulation ohne weiteres möglich. Ist bei- 
spielsweise einmal die Heizleistung eines antiken Ofens thermodynamisch 
durch eine Simulation ermittelt worden, so kann das Ergebnis problemlos in 
die Vergangenheit übertragen werden. Von daher erscheint das Anwendungs- 
gebiet naturwissenschaftlicher Simulationen weitaus begrenzter. Doch gibt es 
historische Prozesse, die mit naturwissenschaftlichen Gesetzen zu fassen sind — 
zum Beispiel in der Technik- und Wissenschaftsgeschichte oder der Histori- 
schen Geographie. Das Ziel der Simulation liegt dabei anders als bei der Modell- 
rechnung nicht in der Vorhersage menschlicher Handlungen, sondern vielmehr 
in der Rekonstruktion der naturwissenschaftlich erfassten Umwelt der histori- 
schen Akteur:innen. Die Reaktion auf oder der Umgang mit dieser Umwelt ent- 
zieht sich hingegen der Simulation. Hinzu kommt, dass Simulationen (wie alle 
naturwissenschaftlichen Verfahren) einen falsifizierenden Charakter besitzen.” 
Es können also Zustände und Prozesse ausgeschlossen und so Möglichkeitsräu- 


15 Karl R. Popper und Herbert Keuth, Logik der Forschung, 4., bearb. Aufl. (Berlin: Akad.-Verl., 
2013). 
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me eröffnet werden. Positive Aussagen, wie sie sich aus traditionellen histori- 
schen Quellen erschließen lassen, sind jedoch nicht möglich. Um das gerade 
angeführte Beispiel wieder aufzugreifen: Die Heizleistung eines Ofens kann be- 
rechnet werden. Ob, wie häufig und auf welche Weise ein spezifischer Ofen die- 
ser Bauart jedoch wirklich genutzt wurde, lässt sich ebenso wenig ermitteln, 
wie die Frage, ob einzelne historische Akteur:innen gefroren haben. 

Es gilt also festzuhalten, dass Simulationen historisch-naturwissenschaftli- 
che Möglichkeitsräume eröffnen, in denen Geschichte stattfinden kann, wohin- 
gegen Modellrechnungen erlauben, historische Modelle zu falsifizieren bezie- 
hungsweise die einzelnen Parameter des Systems zu validieren. 

Für Simulationen wie Modellrechnungen gilt, dass sie prognostisch, also 
auf eine Zukunft ausgerichtet sind, wobei sich der Raum des Möglichen mit zu- 
nehmender Distanz von der Gegenwart weitet.!° Ob dieser Ausgangspunkt dabei 
in der Vergangenheit, der Gegenwart oder der Zukunft liegt, beeinflusst beide 
selbst nicht. Allein die Eingangsdaten sind von der zeitlichen Verortung der Si- 
mulation abhängig. Je exakter die historischen Umstände ermittelbar sind, des- 
to besser sind die Eingangsdaten und damit auch die historisch-prognostischen 
Ergebnisse. 

Im Gegensatz zu Simulation und Modellrechnung ist Historie immer von 
Heute auf die Vergangenheit hin ausgerichtet, wobei sich auch hier mit zuneh- 
mender Zeit der Raum des Möglichen weitet. Die historischen Quellen geben 
uns nun mit ihren individuellen Aussagen Wegmarken, aus denen wir im Rah- 
men des Möglichkeitsraums Narrative (re-)konstruieren können, die wiederum 
in eine vergangene Zukunft gerichtet sind. Ähnlich verhält es sich bei histori- 
schen Simulationen und Modellrechnungen. Diese benötigen einen Startpunkt, 
der von unseren Modellen abhängig ist. Von hier aus können sie in ihren jewei- 
ligen Grenzen wiederum die Möglichkeitsräume bestimmen, wobei die histori- 
schen Quellen für eine Falsifikation der Algorithmen genutzt werden können. 
Man kann also von einer historisch prognostischen Vorgehensweise sprechen, 
welcher eine doppelte Unschärfe innewohnt, die des Ausgangspunktes und die 
der Simulation beziehungsweise im verstärkten Maße der Modellrechnung. 

Doch wie ist nun das Verhältnis zu den traditionellen historischen Quellen? 
Betrachten wir dies beispielhaft anhand eines generischen Berichts über eine 
Flussschiffahrt und einer Simulation derselben. Im einfachsten Fall stimmen 


16 Hierfür ein kurzes Beispiel. Meteorologische Simulationen erlauben uns für den heutigen 
Tag sehr klare und abgegrenzte Aussagen über das lokale Wetter. Betrachten wir den Bericht 
für eine Woche, so sind die Ergebnisse immer nicht mehr so exakt, wie bei der Tagesvorher- 
sage. Eine Simulation des Wetters (nicht des Klimas) in 50 Jahren jedoch wird zumindest in 
absehbarer Zeit über eine generelle Aussage nicht hinausgehen. 
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die Daten beider Quellen tiberein. Dann ist die Simulation valide und der Reise- 
bericht nennt zumindest realistische Zahlen, ohne dass jedoch von einem ,,Be- 
weis“ oder gar der „Wahrheit“ gesprochen werden kann. Sind die im Reisebe- 
richt genannten Zeiten länger, so ist - vorausgesetzt, die Simulation ist nicht 
noch optimierungsbedürftig - anzunehmen, dass längere Pausen (mit Anlan- 
dungen) gemacht wurden, was wiederum historische Fragen zur Organisation 
der Schifffahrt eröffnet. Im schwierigeren Fall sind die im Reisebericht genann- 
ten Zahlen geringer als die errechneten. Dann gilt es zu hinterfragen, weshalb 
die/der Autor:in der Quelle (bewusst oder unbewusst) angibt, die Strecke jen- 
seits des physikalisch Möglichen zurückgelegt zu haben. Hier ergeben sich eine 
ganze Reihe an weiteren Fragen, zum Beispiel nach dem Zweck der Quelle, dem 
Wissensstand der Autorin oder des Autors oder der Historizität der Reise. 

Am Beispiel des Vergleichs eines Berichtes und einer Simulation einer gene- 
rischen Flussreise zeigt sich der Nutzen von Simulationen in der Inbezugset- 
zung mit traditionellen Quellen. Nochmals hervorzuheben ist dabei, dass die Si- 
mulation lediglich einen naturwissenschaftlichen Kontext eröffnet, in welchem 
die individuell verifizierende historische Quelle verortet werden kann. Dabei ist 
das Aufzeigen von Widersprüchen und damit das Aufwerfen neuer Fragen die 
zentrale Aufgabe der Simulation. Die Beantwortung der Fragen hingegen liegt 
im Zuständigkeitsbereich der Historiker:innen. Ähnlich verhält es sich im grö- 
ßeren Kontext. Simulationen sind prädestiniert dazu, größere und längerfristige 
Entwicklungen wie beispielsweise den Klimawandel nachzuvollziehen und auf 
einer Makroebene Möglichkeiten und Unmöglichkeiten menschlichen Handelns 
zu skizzieren. Hier besitzen Simulationen auch den Vorteil, dass mehrere poten- 
tielle Entwicklungen parallel zueinander berechnet werden können, was in be- 
grenztem Rahmen „Was-wäre-wenn“-Fragen erlaubt.” 


4 Fazit 


Zwei Begriffsdefinitionen standen im Fokus dieses Beitrages - zum einen die 
der Digital History als algorithmische Annäherung an die Vergangenheit und 
zum anderen die von historischer Simulation und Modellrechnung als Nachbil- 
dung eines Prozesses oder Zustands mit der Zielsetzung der Modellierung und 
Erprobung historischer Systeme für die Gewinnung eines besseren Verständnis- 
ses von Abläufen und Wertigkeiten einzelner Faktoren sowie der Eingrenzun- 


17 Zum Beispiel: Wie hätte sich die historische Landschaft entwickelt, wenn es fünf Grad käl- 
ter gewesen wäre? 
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gen vergangener Zukünfte. Als solche sind historische Simulationen und Mo- 
dellrechnungen ein inhärenter Bestandteil einer im Entstehen begriffenen histo- 
rischen Teildisziplin Digital History. Für eine breite Akzeptanz in der Fachcom- 
munity wird dabei zukünftig entscheidend sein, dass nicht der Anspruch erho- 
ben wird, zu berechnen ‚wie es gewesen ist‘ und sich nicht in romantizistischen 
Wunschträumen einer virtuellen Zeitmaschine zu verstricken, sondern klar die 
Grenzen und Möglichkeiten solcher Ansätze für die Geschichtswissenschaften 
und die in der Interpretation der Ergebnisse benötigten hermeneutischen Ar- 
beitsweise aufzuzeigen. 
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Die Rekonstruktion der materiellen 
Ausstattung von Haushalten in 
Ostdeutschland 1980-2000 


Ein Beispiel für quantitative und digitale Methoden in den 
Geschichtswissenschaften 


Abstract: In the field of study of recent contemporary history, the application 
possibilities of quantification, understood as the translation of historical and 
social phenomena into numerical expression, have expanded immensely. On 
the one hand, this goes along with the easier availability of application-oriented 
statistical software. On the other hand, there are the broad quantitative legacies 
of contemporary empirical social research and official statistics, whose data col- 
lections can be used today for historical reconstruction. This paper traces the 
development of income disparities — as a core dimension of social inequality — 
in East German employee households on the basis of household surveys be- 
tween 1980 and 2000. It illustrates the methodological and epistemological pos- 
sibilities and limitations of working with historical survey data. 


Keywords: quantification, income, social inequality, East German transformati- 
on, survey-data 


Zusammenfassung: Bei der Erforschung der jiingsten Zeitgeschichte haben sich 
die Anwendungsméglichkeiten fiir Quantifizierung, verstanden als Ubersetzung 
von historischen und sozialen Phänomenen in zahlenmäßigen Ausdruck, im- 
mens erweitert. Auf der einen Seite geht dies mit der leichteren Verfügbarkeit 
anwendungsorientierter Statistiksoftware einher. Auf der anderen Seite stehen 
die breiten quantitativen Hinterlassenschaften der jeweils zeitgenössischen em- 
pirischen Sozialforschung und amtlichen Statistik, deren seinerzeitige Datener- 
hebungen heute zur historischen Rekonstruktion nutzbar sind. Im vorliegenden 
Beitrag wird die Entwicklung von Einkommensdisparitäten - als Kerndimensi- 
on sozialer Ungleichheit - in ostdeutschen Arbeitnehmerhaushalten auf Basis 
von Haushaltsbefragungen zwischen 1980 und 2000 nachgezeichnet. Hieran 
werden exemplarisch die methodischen und erkenntnismäßigen Möglichkeiten 
und Grenzen bei der Arbeit mit historischen Surveydaten aufgezeigt. 


8 Open Access. © 2022 Christopher Banditt, published by De Gruyter. [EVER Dieses Werk ist lizensiert 
unter einer Creative Commons Namensnennung 4.0 International Lizenz. 
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Schlagwörter: Quantifizierung, Einkommen, soziale Ungleichheit, ostdeutsche 
Transformation, Surveydaten 


1 Quantifizierung in der Geschichtswissenschaft 


Quantitative Methoden sind nichts Neues in den Geschichtswissenschaften. Mit- 
te der 1970er Jahre hielt Konrad Jarausch fest, dass es sich bei quantitativen An- 
sätzen „nicht um einen radikalen Bruch mit der herkömmlichen Geschichts- 
schreibung, sondern eher um eine Anknüpfung an eine eigene Minoritätstradi- 
tion handelt, deren Anfänge im neunzehnten Jahrhundert von der politischen 
Ereignis- und Persönlichkeitsgeschichte überschattet wurden.“! Bereits 1976 
stellte also quantifizierende historische Forschung kein neues Phänomen dar, 
wenn Jarausch in seinem Beitrag etwa auf die Historische Schule der National- 
ökonomie im 19. Jahrhundert anspielt, die allerdings nie eine hervorgehobene 
oder gar bestimmende Stellung wie der Historismus in der Geschichtswissen- 
schaft einnehmen sollte.” Zwar hat es mit der Konjunktur der Sozialgeschichte 
in den 1970er Jahren durchaus eine zwischenzeitliche Zunahme quantitativ aus- 
gerichteter historischer Arbeiten gegeben.’ Jedoch gehören heute die „histori- 
schen Quantifizierer:innen“ wieder beziehungsweise weiterhin nicht gerade 
zum Mainstream in der Geschichtswissenschaft, wenngleich mit der Cliometrie/ 
New Economic History eine Schule existiert, die wirtschafts- und sozialhistori- 
sche Fragestellungen mit dezidiert quantitativ-statistischen Methoden (und in 
der Regel theoriegeleitet) bearbeitet. 

Abseits der Fragen, wie alt oder neu quantitative Methoden sind und wel- 
chen Stellenwert sie in der historischen Wissenschaft nun genau einnehmen, 
ist hier vor allem der semantische Gehalt des Begriffs „Quantifizierung“ von Re- 
levanz. Dem Soziologen Steffen Mau zufolge bedeutet Quantifizierung, dass 
„Phänomene, Eigenschaften oder Beschaffenheiten eines Sachverhalts in einer 


1 Konrad H. Jarausch, „Möglichkeiten und Probleme der Quantifizierung in der Geschichtswis- 
senschaft,“ in Quantifizierung in der Geschichtswissenschaft. Probleme und Möglichkeiten, hg. v. 
Konrad H. Jarausch (Düsseldorf: Droste Verlag, 1976), 13. 

2 Zu den unterschiedlichen Auffassungen der Schulen über den Wert historischer Statistiken 
siehe die prägnante und anschauliche Schilderung bei: Thomas Rahlf, „Einleitung,“ in 
Deutschland in Daten. Zeitreihen zur Historischen Statistik, hg. v. Thomas Rahlf (Bonn: Bundes- 
zentrale für politische Bildung, 2015), 5-7. 

3 Vgl. Michael Buchner et al., „Zur Konjunktur des Zählens — oder wie man Quantifizierung 
quantifiziert. Eine empirische Analyse der Anwendung quantitativer Methoden in der deut- 
schen Geschichtswissenschaft,“ Historische Zeitschrift 310 (2020): 580-621. 
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allgemeinen, abstrakten und universell anschlussfähigen Sprache repräsentiert 
werden, der der Mathematik.“ Demnach bringt Quantifizierung „eine unüber- 
sichtliche und komplexe Welt in die standardisierte Sprache der Zahlen, in wel- 
cher eindeutige Ordnungsverhältnisse von größer oder kleiner (oder von mehr 
oder weniger) herrschen.“ Indem komplexe Realitäten in Zahlenform übersetzt 
werden, werden sie mess- und skalierbar und lassen sich folglich rechnerisch- 
statistisch beschreiben und analysieren. Auf die Handhabbarmachung von so- 
zialer Komplexität mithilfe mathematischen Ausdrucks wird im Weiteren noch 
zurückzukommen sein, wenn es um die Veranschaulichung der eingesetzten 
Methodik in meinem Dissertationsprojekt geht. 


2 Historische Daten zu ostdeutschen Haushalten 


Das näher vorzustellende Projekt „Soziale Ungleichheit in Ostdeutschland 
1980-2000. Die materiellen Lagen von Arbeitnehmerhaushalten im Wandel“ 
widmet sich folgender Themenstellung: Welche Ausprägungen hatte die materi- 
elle Ausstattung ostdeutscher Arbeitnehmerhaushalte in der letzten sozialisti- 
schen Dekade und im ersten „Nachwendejahrzehnt“? Die materielle Lage und 
ökonomische Situation von Haushalten wird generell als eine der wichtigsten 
Dimensionen von sozialer Ungleichheit verstanden.° Primärindikatoren sind 
das verfügbare Einkommen der Haushalte, Vermögenswerte und die damit ver- 
bundenen Konsummöglichkeiten, die sich insbesondere in der Ausstattung mit 
langlebigen, technischen Konsumgütern niederschlagen. Allerdings geht es 
nicht allein um die deskriptive Abbildung von Kenngrößen und Verteilungs- 
maßzahlen. Da soziale Ungleichheit immer ein Produkt der sozialen Strukturen 
und Beziehungsgefüge ist,’ sind auch die Bestimmungsfaktoren im gesellschaft- 
lichen Rahmen für das Zustandekommen und die Entwicklungen bestimmter 
Ungleichheitsrelationen zu analysieren. 

Im Sozialismus vorherrschende Disparitäten sind insofern von besonderem 
Interesse, als doch dort das Marxsche Diktum galt, wonach „mit der Abschaf- 


4 Steffen Mau, Das metrische Wir. Über die Quantifizierung des Sozialen (Berlin: Suhrkamp Ver- 
lag, 2017), 27. 

5 Ibid. 

6 Vgl. Stefan Hradil, „Soziale Ungleichheit, soziale Schichtung und Mobilität,“ in Einführung 
in Hauptbegriffe der Soziologie, hg. v. Hermann Korte und Bernhard Schäfers (Wiesbaden: 
Springer VS, 2016), 9. Auflage, 250. 

7 Vgl. Stefan Hradil, Soziale Ungleichheit in Deutschland (Wiesbaden: Springer VS, 2005), 8. 
Auflage, 30. 
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fung der Klassenunterschiede von selbst alle aus ihnen entspringende soziale 
und politische Ungleichheit verschwindet.“® Für den Kapitalismus ist soziale 
Ungleichheit als systemerhaltendes Wesensmerkmal identifiziert worden.? Wird 
nun mit einem Untersuchungszeitraum von 1980 bis 2000 eine integrale, zäsur- 
übergreifende Perspektive eingenommen, lässt sich das Zutreffen dieser Sys- 
temzuschreibungen ebenso untersuchen, wie die Frage, ob neben den Umbrü- 
chen auch mögliche Kontinuitäten über 1989/90 vorherrschten. Inwieweit wa- 
ren sozioökonomische Entwicklungen im Ostdeutschland der 1990er Jahre 
bereits durch soziale Anordnungen in der DDR historisch vorgrundiert? Die Be- 
schäftigung mit vertikaler Ungleichheit wirft naturgemäß Fragen nach einem 
„Mehr“ und „Weniger“ zwischen sozialen Gruppen auf. Die Rekonstruktion ver- 
gangener materieller Verteilungen erfordert geradezu deren Übersetzung in ma- 
thematische Relationen, sie legt folglich quantitative Quellen und Auswertungs- 
methoden nahe. 

Um zu historischen Statistiken beziehungsweise Datenreihen zu gelangen, 
gibt es grundsätzlich zwei Wege. Zum einen lassen sich qualitative Quellen aus- 
werten und durch Klassifizierung, Kodierung und Kategorisierung in numeri- 
sche Werte übertragen. Hierbei wären beispielsweise Oral-History-Interviews 
mit ostdeutschen Arbeitnehmerhaushalten zu ihren Einkommen in den 1980er 
und 1990er Jahren denkbar. Die so erfragten Angaben könnten dann das Basis- 
material einer Zeitreihenkonstruktion bilden. Jedoch ist es nicht nur sehr un- 
wahrscheinlich, dass bei den retrospektiv Interviewten ausreichend exakte Er- 
innerungen zu ihrer materiellen Ausstattung vor 20, 30 oder gar 40 Jahren vor- 
liegen. Zugleich wäre diese Methode mit einem unmäßigen - und letztlich 
unrealistischen — Aufwand verbunden, um ein aussagekräftiges Sample zu ge- 
nerieren. 

Zum anderen lassen sich aus Quellen, die bereits in quantitativer Form vor- 
liegen, die gesuchten Variablenwerte extrahieren. Ist das Basismaterial als seri- 
elle Quelle angelegt, können die gewonnenen Angaben sogar zu Datenreihen 
kompiliert werden, die intertemporale Vergleiche und eine Beschreibung der 
Entwicklung im Zeitverlauf erlauben." In diesem Sinne würden sich etwaige 


8 Karl Marx, „Kritik des Gothaer Programms,“ in Werke, Bd. 19, Karl Marx und Friedrich Engels 
(Berlin (Ost): Dietz Verlag, 1962 [1875]), 26. 

9 Vgl. Werner Plumpe, Das kalte Herz. Kapitalismus: Die Geschichte einer andauernden Revo- 
lution (Berlin: Rowohlt Verlag, 2019), 23. 

10 Vgl. Tobias A. Jopp und Mark Spoerer, Historische Statistik lehren. Quellenkritische Vermitt- 
lung von Zielen und Methoden statistischen Arbeitens in der Geschichtswissenschaft (Schwal- 
bach/Ts.: Wochenschau Verlag, 2017), 13. 

11 Vgl. ibid., 12-13. 
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jährliche Daten aus der steuerlichen Veranlagung von Einkommen und Vermö- 
gen ostdeutscher Arbeitnehmer:innen heranziehen lassen. Zu bedenken ist je- 
doch, dass Steuerdaten lediglich Aufschluss über steuerpflichtige Einkommen, 
wie das Arbeitseinkommen, geben und dass sie zumeist auf Individualebene 
angelegt sind, womit der Haushaltszusammenhang vernachlässigt würde. 

Um Informationen über die sämtlichen Einnahmen eines Haushalts - wozu 
neben Arbeitseinkommen auch Sozialtransfers oder Vermögenseinkommen 
zählen - zu sammeln, eignen sich letztlich nur zeitgenössisch durchgeführte 
Haushaltsbefragungen.” Idealerweise haben die Haushalte dort nicht nur Aus- 
kunft über ihr Haushaltseinkommen, ihre Vermögenswerte und ihre Ausstat- 
tung mit Konsumgütern zum Befragungszeitpunkt gegeben. Mitabgefragte so- 
ziodemografische Items, wie Personenzahl, regionale Verortung sowie Alter, 
Bildungsgrad oder soziale Stellung der jeweiligen Haushaltsmitglieder, sind für 
weiterführende Analysen ebenfalls von großer Wichtigkeit. 

Zugangsmöglichkeiten zu historischen Surveys bestehen zum Beispiel bei 
den Forschungsdatenzentren des Statistischen Bundesamts und der Statisti- 
schen Landesämter. So bietet sich die größte deutsche Haushaltsbefragung an, 
der jährliche amtliche Mikrozensus, der 1991 in Ostdeutschland eingeführt wor- 
den ist.” Das Statistische Bundesamt stellt die faktisch anonymisierten Daten- 
sätze als Scientific Use Files in einer 70-Prozent-Sub-Stichprobe zur Verfügung; 
in diesen beträgt die Fallzahl ostdeutscher Arbeitnehmerhaushalte für die 
1990er Jahre mehr als 20000. In der DDR war die Staatliche Zentralverwaltung 
für Statistik eine der wenigen Institutionen, die bevölkerungsrepräsentative Be- 
fragungen durchführen durfte. Die Hinterlassenschaften ihrer regelmäßigen 
Einkommensstichprobe in rund 30000 Arbeiter- und Angestelltenhaushalten 
aus den 1980er Jahren werden heute vom Bundesarchiv verwaltet. Allerdings 
liegen diese Archivalien sehr häufig nicht in maschinenlesbarer Form vor, son- 
dern als analoge Ergebnisberichte!*, was zunächst deren Übertragung in ein di- 
gitales Format erfordert(e). 


12 Vgl. Manfred Euler, „Genauigkeit von Einkommensangaben in Abhängigkeit von der Art 
der statistischen Erfassung. Dargestellt am Beispiel der Einkommens- und Verbrauchsstichpro- 
be 1978,“ Wirtschaft und Statistik (1983): 813. 

13 Vgl. Hans-Joachim Heidenreich, „Einführung des Mikrozensus in den neuen Bundeslän- 
dern: Probleme und Erfahrungen,“ in Amtliche Daten der DDR und der neuen Bundesländer: 
Informationsquelle für die Sozialwissenschaften. Tagungsdokumentation, hg. v. Paul Lüttinger 
und Heike Wirth (Mannheim: ZUMA, 1993), 11-26. 

14 Vgl. Bernhard Schimpl-Neimanns und Heike Wirth, Bestandsaufnahme und Nutzungsmög- 
lichkeiten amtlicher Mikrodaten der DDR für Sekundäranalysen zur Bildungs- und Einkom- 
mensungleichheit (Mannheim: ZUMA, 1994), 7-9. 
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Wahrend solche amtlichen Erhebungen, die vornehmlich zur Informations- 
bereitstellung fiir Politik und Offentlichkeit eingefiihrt worden sind, mit relativ 
hohen Fallzahlen aufwarten, sind die Surveys sozialwissenschaftlicher Produ- 
zent:innen in dieser Hinsicht meistens kleiner dimensioniert. Letztere warten 
dafür oftmals mit einer größeren Bandbreite an abgefragten Merkmalen auf, die 
dann über die „harten“ sozioökonomischen Items der amtlichen Befragungen 
hinausgehen, indem sie etwa auch Fragen zu mentalen Settings und Perzepti- 
onsmustern einbeziehen. Zu nennen ist in diesem Zusammenhang das Datenan- 
gebot des GESIS — Leibniz-Instituts für Sozialwissenschaften. Über dessen Inter- 
netpräsenz ist eine Vielzahl an Befragungen auffindbar, die hauptsächlich von 
sozialwissenschaftlichen Instituten durchgeführt worden sind - so auch aus 
der DDR-Zeit.4 Für die 1990er-Jahre kann zudem auf den Datensatz des Sozio- 
oekonomischen Panels (SOEP) zurückgegriffen werden, das 1990 - sechs Jahre 
nach der ersten Erhebungswelle in der alten Bundesrepublik - mit einer Stich- 
probengröße von mehr als 2000 Haushalten auch in Ostdeutschland etabliert 
worden ist.!° Im SOEP werden (mit zwischenzeitlichen Auffrischungsstichpro- 
ben) immer dieselben Haushalte befragt, was Zeitverlaufsanalysen, wie zu so- 
zialer Mobilität, sehr begünstigt. 


3 Bevölkerungsbefragungen als geschichtliche 
Quelle 


Mit den höheren Fallzahlen, die Surveys in der Regel aufweisen, geht eine grö- 
Bere Aussagekraft beziehungsweise Verallgemeinerbarkeit einher - je nach me- 
thodischem Design, wenn es sich beispielsweise um eine Zufallsstichprobe han- 
delt, ließe sich auch von Repräsentativität sprechen -, als sie mit qualitativen 
Erhebungen, wie Interviews, gemeinhin erreicht wird. Allerdings lassen Survey- 
daten kein so tiefes Eindringen in die Umstände und Motivlagen der Untersu- 
chungsobjekte zu. Ja/Nein-Abfragen oder die Erfassung von Mentalitäten und 
Einstellungen über graduelle Antwortskalen von „starker“ bis „geringer Zustim- 
mung“ sind hierbei etwa gegenüber Ego-Dokumenten, wie Tagebücher oder 
Briefe, klar im Hintertreffen. Auf eher „schweigende Gruppen“, die selten für 


15 Vgl. Michael Wettengel, „Sozialwissenschaftliche Daten aus der DDR - ein Katalog archi- 
vierter Studien,“ Historische Sozialforschung 20 (1995): 127-134. 

16 Vgl. Gert G. Wagner, „Die Längsschnittstudie Sozio-oekonomisches Panel (SOEP) - Die Jah- 
re von der Wende zur Jahrtausendwende,“ Vierteljahrshefte zur Wirtschaftsforschung 77 (2008): 
43-62. 
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(Zeitzeugen-)Interviews zur Verfügung stehen oder kaum persönliche Doku- 
mente hinterlassen, bieten Befragungsdaten wiederum potenziell größere Zu- 
griffsmöglichkeiten. Dies umso mehr, je geringer der Antwortausfall und Non 
Response Bias einer Erhebung ist; beim Mikrozensus besteht sogar eine gesetzli- 
che Auskunftspflicht (die wiederum freilich nicht vor bewussten Falschangaben 
schützen kann). 

Regelmäßig durchgeführte Wiederholungsbefragungen, die durch ein 
gleichbleibendes Fragenprogramm charakterisiert sind, und speziell Panelerhe- 
bungen, in die darüber hinaus immer dieselben Personen und Haushalte einbe- 
zogen sind, ermöglichen konzise Zeitverlaufsanalysen. Quantitative Quellen 
sind für die Zeitgeschichte insbesondere aus Phasen schnellen Umbruchs über- 
liefert. Wenn rasche Ergebnisse gefragt sind, stellen leichter aufzusetzende und 
durchzuführende quantitative Befragungen für Sozialwissenschaftler:innen zu- 
meist das Instrument der Wahl vor qualitativen Erhebungen dar.” Beobachten 
ließ sich das beispielsweise während der Corona-Krise 2020/21, als eine Vielzahl 
von Surveys den Umgang mit der Pandemie zu beschreiben suchte. Auch wäh- 
rend des ostdeutschen Umbruchs 1989/90 kam es zu einer ,,explosionsartige[n] 
Zunahme von Wahlforschung, Meinungsumfragen, Mediaanalysen und Umfra- 
gen auf Demonstrationen“, um den sich verändernden Lebensverhältnissen 
der Ostdeutschen wie auch ihren Zukunftserwartungen nachzuspiiren.” 

Die Uberlieferungsform eines Surveys ist in aller Regel ein numerisch co- 
dierter digitaler Datensatz. Wenn eine Erhebung direkt als Online-Befragung 
oder als sogenanntes Computer Assisted Personal Interview (CAPI) durchgefiihrt 
worden ist, liegt eine genuin digitale Quelle vor. Auch aus Papierbefragungen 
(PAPI: Paper and Pencil Interview) entstehen digitale Datensätze, wenn die Roh- 
daten in Form ausgefüllter Fragebögen eingescannt und analoge in digitale In- 
formationen umgewandelt werden. Dies erleichtert ihre Auswertung mittels 
softwarebasierter Analyseprozeduren, faktisch wird die Nutzbarmachung so 
überhaupt erst möglich. Bei Befragungen mit mehreren hundert oder tausend 
Fallzahlen ist eine händische Auswertung der zugrundeliegenden Fragebögen 
kaum realisierbar. 

Wie der Großteil geschichtlicher Quellen sind auch Surveydatensätze origi- 
när nicht zum Zwecke der späteren historischen Rekonstruktion vergangener 
Realitäten entstanden. Die jeweiligen Sozial- und Wirtschaftswissenschaftler:in- 


17 Vgl. Kerstin Brückweh, „Wissen über die Transformation. Wohnraum und Eigentum in der 
langen Geschichte der ‚Wende‘,“ Zeithistorische Forschungen 16 (2019): 36. 

18 Wettengel, „Sozialwissenschaftliche Daten,“ 132. 

19 Vgl. Christopher Banditt, „Einheitserwartungen. Präferenzen, Hoffnungen und Befürchtun- 
gen im ‚Wendejahr‘ 1989/90,“ Berliner Debatte Initial 30 (2019): 67-84. 
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nen oder amtlichen Statistiker:innen haben mit ihnen ganz eigene und haupt- 
sächlich gegenwartsbezogene Absichten verfolgt. Folglich sind auch an diese 
Daten klassische „W-Fragen“ einer traditionellen Quellenkritik zu stellen: Wer 
hat was, wann, wie und warum erhoben? Dies ist notwendig, um zu prüfen, ob 
überlieferte Datensätze aus bestimmten Haushalts- und Personensurveys 
grundsätzlich tauglich sind, die eigene historische Fragestellung zu beantwor- 
ten.?° Für die äußere Quellenkritik sind Metadaten nutzbar, die ein gutes For- 
schungsdatenzentrum als Host von Datensätzen zur Verfügung stellt. Zu sol- 
chen Metadaten zählen Informationen über jeweilige Erhebungsmethoden, Co- 
debücher, damals eingesetzte Fragebögen oder Leitfäden für Interviewer:innen. 
Oftmals werden in Codebüchern bereits Häufigkeitsverteilungen der Variablen 
mit ausgegeben, die sich zu rein deskriptiven Zwecken bereits nutzen lassen.” 
Jedoch bleibt ohne Auswertung möglicher Kontextvariablen im Datensatz ein 
bestimmtes Antwortverhalten in der Tat ,,[s]chwierig zu interpretieren.“ 

Für das hier anzuzeigende Projekt wurden über die Metadaten zunächst Er- 
hebungen in Ostdeutschland ausfindig gemacht, die die Variable „Haushalts- 
einkommen“ beinhalten. Dabei wurde für die DDR-Einkommensstichprobe an- 
hand des überlieferten Fragebogens deutlich, dass die Nettogeldeinnahmen der 
Haushaltsmitglieder zum einen als exakte Werte und zum anderen differenziert 
nach Einkommensarten (Nettolohn/-gehalt, Kindergeld, sonstige Einnahmen 
und so weiter) erhoben wurden. Dahingegen zeigten die Metadaten zum bun- 
desdeutschen Mikrozensus, dass das Haushaltseinkommen ganz pauschal und 
klassiert in einem „Von-bis-Bereich“ abgefragt wurde. Zur Einschätzung der 
Verwertbarkeit von Datensätzen und der Adäquanz der zugrunde liegenden Er- 
hebungsmethodik sind Grundkenntnisse der empirischen Sozialforschung not- 
wendig, um nicht etwa unbeabsichtigt einem unsauber arbeitenden Befra- 
gungsinstitut aufzusitzen.” 

Für eine innere Quellenkritik sind darüber hinaus digitale Methoden im en- 
geren Sinne notwendig, wenn es darum geht, die tatsächlichen Daten auf ihre 
Verwertbarkeit zu überprüfen. Bei welchen Items fallen Missings an, wie hoch 
liegt der Antwortausfall? Gibt es Gruppen, die bei bestimmten Fragen mit Ant- 


20 Vgl. Jopp und Spoerer, Historische Statistik, 14; Eva Pfanzelter, „Die historische Quellenkri- 
tik und das Digitale,“ Archiv und Wirtschaft 48 (2015): 11. 

21 Vgl. z.B. Brückweh, „Wissen über die Transformation,“ passim. 

22 Ibid., 39. 

23 Dies ist beispielsweise der Fall bei Manfred Görtemaker, „Gestaltung der Wiedervereini- 
gung,“ Informationen zur politischen Bildung 250 (2015): 68, wo auf unplausible Zahlen des 
verrufenen Wickert-Instituts rekurriert wird. Vgl. „Falsche und gefälschte Zahlen. Demoskopen 
in Deutschland: Wickert intern,“ Der Spiegel, 9. Oktober 1978. 
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wortverweigerung reagieren (zum Beispiel Arbeitslose oder Rentner:innen beim 
Thema Arbeitseinkommen)? Wie plausibel sind die Daten insgesamt? 


Tab. 1: Persönliches monatliches Bruttoeinkommen vorzeitig exmatrikulierter Student:innen 
1986 (in Mark) 


~ Wert Häufigkeit Prozent Kumulierte 
Prozente 
150 1 0,4 0,4 
190 1 0,4 0,8 
200 24 9,2 9,8 
215 4 1,5 11,5 
250 1 0,4 11,8 
260 3 1,1 13,0 
1300 4 1,5 98,5 
1350 1 0,4 98,9 
1500 1 0,4 99,2 
1800 1 0,4 99,6 
7000 1 0,4 100,0 
Gesamt 262 100,0 


Ausgewertet nach: Zentralinstitut für Jugendforschung, „Studenten-Intervallstudie Leistung 
SIL-EX II 1986,“ GESIS Datenarchiv, Köln. ZA6137, Datenfile Version 1.0.0. doi: 10.4232/1.6137 


Vom DDR-Zentralinstitut für Jugendforschung in Leipzig ist eine Befragung aus 
dem Jahr 1986 überliefert, in der ohne Abschluss exmatrikulierte Student:innen 
um die Angabe ihres monatlichen Bruttoeinkommens gebeten worden sind. Die 
(hier mit Aussparung versehene) Häufigkeitsverteilung zeigt einen bei 150 Mark 
beginnenden Wertebereich, der bei 1800 Mark enden würde, wenn nicht noch 
ein:e Respondent:in mit 7000 Mark an Einkommen in der Stichprobe wäre (sie- 
he Tabelle 1). Angesichts der Tatsache, dass Erich Honecker 1980 über ein mo- 
natliches Gehalt von 6500 Mark verfügte”, könnte man einerseits von gelebtem 
Sozialismus sprechen, in dem manch ehemalige:r Student:in ebenso viel ver- 
diente wie der Staatsratsvorsitzende. Andererseits sollte man wohl eher anneh- 


24 Vgl. Jens Gieseke, „Soziale Ungleichheit im Staatssozialismus. Eine Skizze,“ Zeithistorische 
Forschungen 10 (2013): 182. 
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men, dass der Wert nicht korrekt ist: dass beim Ausfiillen des Fragebogens oder 
bei der Transformation der analogen Information in digitales Format schlicht- 
weg eine Null hinzugekommen ist. 


4 Methoden der Auswertung 


Um in Datensätze „hinzuschauen“ und Merkmalsausprägungen gegebenenfalls 
zu plausibilisieren — indem man solch einen extremen Ausreißerwert auf 700 
korrigiert oder ihn von der Verteilung abschneidet -, sind Kenntnisse entspre- 
chender Statistiksoftware nötig. Daneben können Filterungen oder Umformun- 
gen bestimmter Variablen notwendig werden. Mit klassiert vorliegenden Ein- 
kommensangaben (wie im Mikrozensus) können keine Berechnungen vorge- 
nommen werden, sodass hier den Einkommensgruppen Repräsentanzwerte 
zuzuweisen sind.” Vorbereitende statistische Verfahren sind mitunter auch re- 
levant, um Daten unterschiedlicher Provenienz miteinander passgerecht zu ma- 
chen. Beispielsweise wurde in den Datensätzen der amtlichen DDR-Einkom- 
mensstichprobe als Haushaltsvorstand die:der Haupteinkommensbezieher:in 
definiert. Im Mikrozensus der amtlichen Statistik der Bundesrepublik wurde 
hingegen der Haushaltsvorstand vom Haushalt selbst benannt (wobei die Wahl 
im Großteil der Fälle auf den „Mann im Haus“ fiel). Anhand der sozialen Stel- 
lung des Haushaltsvorstands wird zugleich der gesamte Haushalt klassifiziert, 
zum Beispiel als Arbeiter- oder Angestelltenhaushalt. Hieran wird deutlich, wie 
wichtig die Vergleichbarkeit der statistischen Quellen bei der Generierung von 
Datenreihen ist. Entsprechende Datensatzpräparationen - wie das behutsame 
Anpassen der Methodik des einen an die Methodik des anderen Datensatzes -, 
die der eigentlichen Auswertung vorgelagert sind, erfordern bereits statistische 
Kenntnisse und Softwarekompetenzen. 

Verbreitete Statistikprogramme sind STATA, R und insbesondere das ein- 
steigerfreundliche SPSS. Standardauswertungen sind mit SPSS über die Dialog- 
felder der grafischen Benutzeroberfläche möglich. Dies beinhaltet einfache Häu- 
figkeitsauszählungen (wie oft kommt eine Merkmalsausprägung innerhalb der 
Stichprobe vor) oder die Erstellung von Kreuztabellen (wie sind bestimmte Va- 


25 Vgl. Johannes Stauder und Wolfgang Hüning, „Die Messung von Äquivalenzeinkommen 
und Armutsquoten auf der Basis des Mikrozensus,“ Statistische Analysen und Studien Nord- 
rhein-Westfalen 13 (2004): 9-31. 

26 Vgl. Anthony B. Atkinson, Ungleichheit. Was wir dagegen tun können (Stuttgart: Klett-Cotta 
Verlag, 2016), 66. 
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riablen in verschiedenen Gruppen ausgeprägt). Und auch die Durchführung 
komplexerer statistischer Verfahren, wie lineare multiple Regressionen (wel- 
chen Einfluss haben mehrere Variablen jeweils auf die Ausprägung einer zu un- 
tersuchenden Variable), gestattet SPSS über eine Schaltflächenauswahl und 
ohne dass Programmieraufwand zwingend notwendig würde. Daneben lassen 
sich spezielle Analysen und Berechnungen, die im SPSS-Menü nicht vorgesehen 
sind, mithilfe von Syntax-Befehlen programmieren. 

Zum Beispiel bietet SPSS originär keine Berechnung des sogenannten Gini- 
Koeffizienten an, sodass hierfür eigens eine SPSS-Syntaxroutine geschrieben 
werden musste (siehe nachfolgende Programmieranwendung). Der Gini-Koeffi- 
zient zählt zu den am häufigsten verwendeten Ungleichheitsmaßen und nimmt 
einen Wert von 0 bis 1 an. Wenn alle Untersuchungseinheiten (etwa Haushalte 
oder Personen) über dasselbe Einkommen verfügen, beträgt der Gini einer Ein- 
kommensverteilung 0. Erhält im Extremfall ein Haushalt oder eine Person das 
gesamte verfügbare Einkommen, während alle anderen gar kein Einkommen 
haben, liegt der Gini bei 1.7” Je größer die Ungleichheit, umso höher also der 
Gini. 

SPSS-Syntaxroutine zur Berechnung des Gini-Koeffizienten (eigener Pro- 
grammcode für Variable „EINKOMMEN“): 


COMPUTE N=1. 

EXECUTE. 

AGGREGATE 

/OUTFILE=* MODE=ADDVARIABLES 
/BREAK=N 

/FAELLE=N 
/EINKOMMEN_SUM=SUM(EINKOMMEN ) . 
EXECUTE. 


SORT CASES BY EINKOMMEN(A). 
EXECUTE. 


COMPUTE ANTEIL_EINK = EINKOMMEN / EINKOMMEN_SUM. 
EXECUTE. 


27 Rechnerisch kann der Wert 1 nur vom normierten und nicht vom einfachen Gini erreicht 
werden; vgl. Henriette Engelhardt, „Modelle zur Messung und Erklärung personeller Einkom- 
mensverteilungen,“ in Handbuch der Demographie, Bd. 2: Anwendungen, hg. v. Ulrich Mueller, 
Bernhard Nauck und Andreas Dieckmann (Berlin: Springer, 2000), 1075-1076. Mit dem Syn- 
taxbeispiel wird der normierte Gini berechnet. 
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COMPUTE ANTEIL_KUM = ANTEIL_EINK. 
IF ($CASENUM > 1) ANTEIL_KUM = ANTEIL_EINK + LAGCANTEIL_KUM) . 
EXECUTE. 


COMPUTE TRAPEZ = ANTEIL_KUM / (2 * FAELLE). 
IF ($CASENUM > 1) TRAPEZ = (ANTEIL_KUM + LAGCANTEIL_KUM)) / (2 * FAELLE). 
EXECUTE. 


AGGREGATE 

/OUTFILE=* MODE=ADDVARIABLES 
/BREAK=N 
/TRAPEZ_SUM=SUM(TRAPEZ). 
EXECUTE. 


COMPUTE GINI = (1/2 - TRAPEZ_SUM) * 2 * FAELLE / (FAELLE - 1). 
EXECUTE. 


ALTER TYPE GINI (f8.5). 
FREQUENCIES GINI. 


DELETE VARIABLES N FAELLE EINKOMMEN_SUM 
ANTEIL_EINK ANTEIL_KUM TRAPEZ TRAPEZ_SUM. 
EXECUTE. 


Wenn eine komplexe soziale Realität wie Einkommensungleichheit in einer ein- 
zigen mathematischen Kennzahl verdichtet wird, mag das bisweilen seltsam er- 
scheinen. Und zweifellos geht mit einer solchen Reduktion ein großer Informa- 
tionsverlust einher. Jedoch wird somit die Beobachtung der Entwicklung von 
Einkommensungleichheit im Zeitverlauf erst ermöglicht oder zumindest erleich- 
tert. Für die ostdeutschen Arbeitnehmerhaushalte zwischen 1980 und 2000 
zeigt der Gini-Koeffizient eine augenfällige Zunahme der Ungleichheit bei den 
Pro-Kopf-Haushaltseinkommen mit dem Systemumbruch (siehe Abbildung 1). 
Neben einer stärkeren Differenzierung der Arbeitseinkommen in der Marktwirt- 
schaft zeichnete hierfür vor allem die Zunahme der Arbeitslosigkeit verantwort- 
lich (Haushalte von Arbeitslosen sind als „potentielle Arbeitnehmerhaushalte“ 
miteinbezogen). 
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Abb. 1: Gini-Koeffizient für die Haushaltseinkommen pro Kopf in ostdeutschen Arbeitnehmer- 
haushalten. Eigene Berechnung nach: Einkommensstichprobe 1980-1988, BArch DE2/60151- 
60156; FDZ der Statistischen Ämter des Bundes und der Länder, Mikrozensus 1991-2000. 


Insbesondere, wenn sie auf Grundlage subjektiver Selbstauskünfte von Perso- 
nen berechnet werden, ist zu bedenken, dass mathematische Resultate weniger 
mit der objektiven Exaktheit, die ihnen innezuwohnen scheint, sondern eher 
als Größenordnung zu interpretieren sind. In diesem Sinne weist die Entwick- 
lung des Gini-Koeffizienten darauf hin, dass es zwischen 1985 und 1988 auch 
eine Phase der Abmilderung von Ungleichheit gab. Ursächlich hierfür war pri- 
mär eine Erhöhung des Kindergeldes, von der in erster Linie die in der Einkom- 
menshierarchie häufiger unten stehenden „kinderreichen“ Haushalte profitier- 
ten. Denn auch im Sozialismus war, wie später in der Marktwirtschaft, die An- 
zahl der Kinder ein bedeutsamer Bestimmungsfaktor der materiellen Lage - 
dies ist zugleich ein Beispiel für vorherrschende Kontinuitäten zwischen den 
1980er und 1990er Jahren.” 

Methodisch geht es folglich nicht darum, Datenreihen um ihrer selbst wil- 
len zu produzieren, sondern auf ihnen aufbauend historische Erklärungsfakto- 
ren für soziale Ungleichheit ausfindig zu machen. Die mit digitalen quantifizie- 


28 Vgl. Christopher Banditt, „Sozioökonomische Lagen ostdeutscher Arbeitnehmerhaushalte 
in der Systemtransformation,“ in Der Zusammenbruch der alten Ordnung? Die Krise der Sozialen 
Marktwirtschaft und der neue Kapitalismus in Deutschland und Europa, hg. v. Christoph Lorke 
und Rüdiger Schmidt (Göttingen: Wallstein Verlag, 2020), 224-226. 
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renden Methoden generierten Statistiken und Zeitreihen sind immer auch zu 
historisieren, indem sie im gesellschaftlichen, politischen und wirtschaftlichen 
Rahmen kontextualisiert werden. Wenn zum Beispiel tiberlieferte quantitative 
Erhebungen der DDR-Soziologie offenbaren, dass Haushalte mit SED-Mitglie- 
dern häufiger über eine moderne Wohnung (mit Fernheizung, Dusche/Bad, In- 
nen-WC) verfügten als „Nicht-SED-Haushalte“, und sich für diesen Zusammen- 
hang aus den Datensätzen eine hohe statistische Signifikanz ergibt, lassen sich 
daraus noch keine eindeutigen historischen Wirkkräfte ableiten. Pointiert ge- 
fragt: Erhielten SED-Kader aufgrund ihrer SED-Mitgliedschaft öfter eine moder- 
ne Wohnung? Oder wurde ihnen und ihrem Haushalt zuerst die moderne Woh- 
nung zugewiesen und sie sind dann - etwa aus Dankbarkeit dafür - in die SED 
eingetreten? Die statistischen Zusammenhangsmaße, die sich aus den Mikroda- 
ten als Quellenmaterial berechnen lassen, müssen in den jeweiligen geschichtli- 
chen Kontext eingeordnet werden, um Wirkungsmechanismen zu identifizieren. 
Erst daraus ergibt sich das historische Narrativ. 

Um aber überhaupt statistische Zusammenhänge als Anhaltspunkte zu 
gewinnen, sind entsprechende Kompetenzen bei der Verarbeitung und Aus- 
wertung digitaler Datensätze aus Bevölkerungsbefragungen notwendig. Doch 
warum sollten Historiker:innen überhaupt Surveydaten auswerten und nicht 
einfach auf die Ergebnisse derer Produzenten, der Sozial- und Wirtschaftswis- 
senschaften, rekurrieren? Zunächst einmal ergeben sich aus historischer Per- 
spektive mitunter andere Fragen ans Material, als sie zeitgenössisch von den 
Soziolog:innen und Okonom:innen gestellt worden sind. Ferner lassen sich be- 
stimmte leitende theoretische Annahmen bei der ursprünglichen Befragungs- 
konzeption mit ihren Implikationen für die Forschungsresultate zumeist erst 
identifizieren, wenn das Datenmaterial konkret bewertet wird. Dies gilt auch für 
bestimmte Besonderheiten von Erhebungen und methodische Unterschiede 
zwischen verschiedenen Befragungen (wie es hier anhand der Art der Einkom- 
mensabfrage knapp skizziert worden ist). Zudem liegen sozialwissenschaftli- 
chen Ergebnissen oftmals noch Hochrechnungs- und Gewichtungsprozeduren 
zugrunde, die nur mit einer eigenen Beschäftigung mit den Primärdatenfiles 
nachvollzogen werden können. Ähnliches gilt für den Umgang mit Missings, 
statistischen Ausreißern und unplausiblen Werten. Es ist letztlich unerlässlich, 
dass die historische Quellenkritik solche Punkte adressieren kann. 
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5 Schlussbemerkungen 


Wie eingangs angedeutet sind digitale quantifizierende Methoden an sich 
nichts Neues. Sozial- und Wirtschaftswissenschaftler:innen oder auch Psycho- 
log:innen nutzen schon lange digitale Prozeduren zur Auswertung von Befra- 
gungsdaten. Für Wirtschaftshistoriker:innen gilt dasselbe hinsichtlich Einkom- 
mens- und Verbrauchsstichproben. Neuartig sind meines Erachtens allerdings 
Umfang und Menge an überlieferten Surveys, die heute potenziell für histori- 
sche Re-Analysen zur Verfügung stehen. Je näher die zeitgeschichtlich unter- 
suchte Vergangenheit an der Gegenwart liegt, umso größer ist der Fundus an 
solchen quantitativen und digitalen Quellen. Mit dem „Aufstieg der Sozialwis- 
senschaften“ in der zweiten Hälfte des 20. Jahrhunderts ging gleichsam die 
„statistische Vermessung der Gesellschaft“? mittels Datenerhebungen einher. 
Das daraus hervorgegangene Material beinhaltet freilich nicht nur „harte 
Items“, wie zur materiellen Ausstattung von Haushalten. Es finden sich in Erhe- 
bungsdatensätzen - je nach disziplinärer Provenienz - auch „weichere Merk- 
male“, wie zum Beispiel die persönliche politische Einstellung oder auch der 
Bücherbestand eines Haushalts, womit etwa milieu- oder kulturgeschichtlichen 
Forschungen Anknüpfungspunkte gegeben werden. 

Gelangt nun die Zeitgeschichtsforschung mit einem stärkeren Einbezug 
quantitativer Quellen - ganz gleich, welche Themenstellung mit ihnen bearbei- 
tet wird - ins „Zeitalter der Quantifizierung“, das George Stigler bereits in den 
1960er Jahren für die Wirtschaftswissenschaft ausgerufen hat?” „[Ulnzweifel- 
haft gehört die Zukunft den Zahlen,“ ließ der französische Schriftsteller Romain 
Gary eine seiner Romanfiguren feststellen: „Seit dem Ende des Rittertums hat 
die Welt gelernt zu rechnen, und das wird immer schlimmer. Wir werden noch 
das Verschwinden all dessen erleben, was nicht beziffert werden kann.“*! Droht 
in der Tat eine Marginalisierung nichtquantifizierbarer Sujets oder der Ge- 
schichtswissenschaft gar die Mathematifizierung, wie sie die Ökonomie erlebt 
hat? Ganz sicher nicht. Vor allem dann nicht, wenn der Tatsache Rechnung ge- 
tragen wird, dass die Mathematik „auch nur eine Sprache [ist], sie kann — wie 
alle Sprachen - nicht alles ausdrücken.“ Und wie wichtig Mehrsprachigkeit in 


29 Eva Schlotheuber und Frank Bösch, „Quellenkritik im digitalen Zeitalter: Die Historischen 
Grundwissenschaften als zentrale Kompetenz der Geschichtswissenschaft und benachbarter 
Fächer,“ H-Soz-Kult, 16. November 2015, aufgerufen am 15. Juli 2021, www.hsozkult.de/deba 
te/id/diskussionen-2866. 

30 George Stigler, „The Economist and the State,“ The American Economic Review 55 (1965): 16. 
31 Romain Gary, Gedächtnis mit Flügeln (Berlin (Ost): Aufbau-Verlag, 1989 [1980]), 74. 

32 Tomáš Sedláček, Die Ökonomie von Gut und Böse (München: Carl Hanser Verlag, 2012), 370. 
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der Geschichtswissenschaft ist, verdeutlicht auch das hier vorgestellte und sich 
eigentlich stark auf zahlenmäßige Ausdrucksformen stützende Beispiel histori- 
scher materieller Disparitäten. 

So wurden Ungleichheitsverhältnisse in der späten DDR zu einem guten 
Teil durch das Verfügen über D-Mark mitbestimmt. Dies lag durchaus quer zu 
anderen Ungleichheitsdimensionen, wie beruflicher Status, Arbeitseinkommen 
(in DDR-Mark) oder gesellschaftliches Prestige. So bot das als „kapitalistisches 
Rudiment“ nur leidlich geduldete private Handwerk seine gefragten Leistungen 
bevorzugt gegen D-Mark an. Beschäftigte in der Gastronomie, die ansonsten 
kaum zu den Besserverdiener:innen in der DDR gehörten, profitierten von 
Trinkgeldern westdeutscher Tourist:innen. Und als „asozial“ kategorisierte Pro- 
stituierte boten etwa ihre Dienste westlichen Messebesuchern oder Unterneh- 
mensreisenden ebenfalls gegen die begehrte Zweitwährung an.” Dagegen hat- 
ten es SED-Kader mangels aktiver Westkontakte deutlich schwerer, West-Mark 
und damit Zugang zu Intershop-Waren zu erhalten. Jedoch liegen über die je- 
weiligen D-Mark-Bestände in Händen einzelner privater Haushalte keine quan- 
titativen Erhebungen vor, sodass sich diese Ausprägung materieller Ungleich- 
heit kaum in verallgemeinerbarer Weise beziffern respektive „mathematisieren“ 
lässt. Gleichwohl ist der Aspekt zu wichtig, um ihn vernachlässigen zu können - 
sodass sich ihm auf Basis des qualitativen Quellenmaterials zu nähern ist. 

Wenn quantitative Hinterlassenschaften die Primärquelle für eine For- 
schungsfrage darstellen, eignen sich qualitative Überlieferungen oft genug für 
komplementäre Tiefensonden. Bei qualitativ zu untersuchenden Themenstel- 
lungen können wiederum entsprechend vorhandene quantitative Erhebungen 
mitunter einen Rahmen setzen, indem sie zunächst den (repräsentativen) Um- 
fang eines Phänomens beschreiben. Grundsätzlich gilt es also, wo möglich, 
quantitatives und qualitatives Material gemeinsam zu analysieren. Während 
qualitative Auswertungsmethoden in den Geschichtswissenschaften traditionell 
fest verankert sind, bilden sozialwissenschaftlich-statistisch inspirierte Ansätze 
eine Ergänzung. Entsprechende digitale Kompetenzen zur Auswertung von Sur- 
veydaten sind unabdingbar, wenn die (zeit-)historische Forschung die Quellen- 
bestände aus quantitativen Bevölkerungserhebungen stärker einbeziehen 
möchte. Dass sie es sollte, ist mein Plädoyer. 


33 Vgl. Steffi Brüning, Prostitution in der DDR. Eine Untersuchung am Beispiel von Rostock, 
Berlin und Leipzig, 1968 bis 1989 (Berlin: be.bra Verlag, 2020), passim. 
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Visuelle Analyse und Kuratierung von 
Biographiedaten 


Abstract: Large volumes of biographical text collections have been digitized 
and developed into structured research databases in recent years. In order to 
strengthen the historiographical relevance and acceptance of these data collec- 
tions, this paper discusses two interdependent technological objectives. First, it 
summarizes advanced visual analysis techniques that can support formal and 
distant reading approaches to individual and aggregated biography data from 
multiple perspectives. On the other hand, it suggests to continuously improve 
structured data collections through an interplay of visual interfaces, manual 
procedures, and semi-automated annotation techniques. This aims at closing 
the operational gap between data analysis and data curation, and at developing 
new tools for the creation and maintenance of biographical data even for histo- 
rians without computer-linguistic skills. 


Keywords: biographical data, visualization, distant reading, data curation, digi- 
tal humanities 


Zusammenfassung: Große Mengen von biographischen Textsammlungen wur- 
den in den letzten Jahren digitalisiert und zu strukturierten Forschungsdaten- 
banken weiterentwickelt. Um die effektive Nutzung dieser Daten strategisch 
weiterzudenken diskutiert der Beitrag zwei interdependente technologische 
Zielsetzungen. Zum einen werden avancierte Techniken der visuellen Analyse 
resümiert, welche formale und distante Lektüren von individuellen und aggre- 
gierten Biographiedaten aus multiplen Perspektiven unterstützen können. Zum 
anderen wird angeregt, strukturierte Daten durch ein balanciertes Zusammen- 
spiel von visueller Analyse, manuellen Verfahren und semi-automatisierten An- 
notationstechniken laufend zu verbessern. Dies zielt auf die Schließung der 
operativen Lücke zwischen Datenanalyse und Datenkuratierung, und auf die 
Schaffung neuer Werkzeuge zur Erstellung und Pflege biographischer Daten 
auch für Historiker:Innen ohne computer-linguistische Methodenkompetenz. 
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Schlagwörter: Biographiedaten, Visualisierung, Distant Reading, Datenkuratie- 
rung, Digitale Geisteswissenschaften 


1 Einleitung 


In den letzten Jahren wurden große Mengen von biographischen Textsammlun- 

gen und Lexika digitalisiert und zu strukturierten Forschungsdatenbanken wei- 

terentwickelt. Die resultierenden prosopographischen Datenbanken eröffnen 
neue Möglichkeiten für die historische Forschung und die Vermittlung von rele- 
vanten Themen an eine interessierte Öffentlichkeit - beispielsweise durch deren 

Verknüpfung mit kulturellen Objekten aus Museen oder Archiven. Bevor Histo- 

riker:innen jedoch die bereits vorhandene Fülle an Informationen ausschöpfen 

und in Forschung und Lehre ebenso wie in Wissenschaftskommunikation und 

Kulturvermittlung produktiv anwenden können, sind zahlreiche Herausforde- 

rungen zu bewältigen. 

Um die effektive Nutzung digitaler Biographiedaten strategisch weiterzu- 
denken, diskutiert dieser Beitrag zwei interdependente technologische Zielset- 
zungen, die die Produktivität von hermeneutischen und kuratorischen Zugän- 
gen zu prosopographischen Informationssystemen auf eine neue Ebene führen 
können: 

- Zum einen wird resümiert, wie prosopographische Informationssysteme 
mittels avancierter Techniken der visuellen Analyse besser erschlossen wer- 
den können. In diesem Kontext sehen wir primär Bedarf für die fachspezifi- 
sche Adaption und Kombination von Techniken der visuellen Analyse für 
die Biographieforschung, die gleichzeitig die Kommunikation der Ergebnis- 
se an die wissenschaftliche Community wie auch an die interessierte Öffent- 
lichkeit erleichtern können. 

- Zum anderen ist zu diskutieren, wie strukturierte biographische Daten 
durch ein balanciertes Zusammenspiel von visuellen Interfaces, manuellen 
Verfahren und semi-automatisierten Extraktionstechniken laufend verbes- 
sert, differenziert und neu kreiert werden können. Dies würde eine Schlie- 
Bung der operativen Lücke zwischen Datenanalyse und Datenkuratierung 
erlauben, und neue Ansätze zur Erstellung und Pflege von Daten auch für 
Historiker:innen ohne computerlinguistische Expertise erschließen. 


Visuelle Analyse und Kuratierung von Biographiedaten — 139 


Ausgehend von diesen Betrachtungen geben wir einen Ausblick darauf, welche 
Möglichkeiten sich durch die Optionen der visuellen Analyse und Kuratierung 
von Biographiedaten für die prosopographische Forschung einerseits und die 
Kommunikation kultureller Themen andererseits eröffnen. 


2 Visuelle Analyse von Biographiedaten 


Prosopographische Datenbanken nutzen je nach Entstehungszeit, Kontext und 
Forschungsfrage unterschiedliche Datenmodelle, die aber zumeist mehrere En- 
titäten (zum Beispiel Personen, Institutionen und Orte) enthalten, denen ver- 
schiedene Attribute zugeordnet (zum Beispiel Berufe) sind und die zueinander 
durch vielfältige Relationen in Beziehung stehen (zum Beispiel Ausbildung, 
Verwandtschaft). Damit bieten sie Informationen über Akteure (einzelne oder 
Gruppen von Personen), deren Aktivitäten (Ereignisse) und Beziehungen zu an- 
deren Entitäten (Relationen) zu bestimmten Zeitpunkten (Zeitstempel). Vor dem 
Hintergrund solch facettenreicher Daten bedarf es aus unserer Sicht neuer - 
insbesondere auch visualisierungsgestützter - Interfaces, die dieser Datenkom- 
plexität gerecht werden und die damit neue Möglichkeiten für die historische 
Forschung und Wissensvermittlung eröffnen. 

Dabei sollten solche visuellen Interfaces den gesamten Forschungsprozess — 
von der Suche nach relevanten Daten bis zu deren Kuratierung, Analyse und 
Kommunikation — unterstützen. Um der Komplexität solcher multidimensiona- 
ler, prosopographischer Datenbanken gerecht zu werden, bedarf es dazu meh- 
rerer, miteinander verknüpfter visueller Analysetechniken (zum Beispiel einer 
geographischen, einer netzwerkanalytischen und einer kategorialen Perspekti- 
ve) unter besonderer Berücksichtigung der zeitlichen Datendimension, der oft 
heterogenen Datenqualität und der Datenprovenienz (siehe auch 3.). Darüber 
hinaus sollten entsprechende Visualisierungssysteme Techniken des „close rea- 
dings“ und des „distant readings“ von individuellen und aggregierten Biogra- 
phiedaten aus den verschiedenen Perspektiven unterstützen. 

Ein Blick auf den Stand der Visualisierungsforschung zeigt, dass bereits 
zahlreiche Techniken im Kontext biographischer Daten angewandt oder entwi- 
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ckelt wurden:! Zeitvisualisierungen?, kartographische Ansichten’, und netz- 
werkanalytische Ansätze*. Die Attribute von einzelnen oder Gruppen von Perso- 
nen wurden mittels hierarchischer Visualisierungstechniken dargestellt.” Zahl- 
reiche Forscher nutzen auch multiple Visualisierungstechniken, um komple- 
mentäre analytische Perspektiven zu bündeln.® 


1 Vgl. auch, Florian Windhager et al., „Beyond One-Dimensional Portraits: A Synoptic Ap- 
proach to the Visual Analysis of Biography Data,“ in BD 2017, CEUR Workshop Proceedings, 
2017, hg. v. Antske Fokkens et al., 67-75. 

2 Stephen Boyd Davis und Florian Kräutli, „Scholarly chronographics: can a timeline be useful 
in historiography?“ In Proceedings of 10th European Social Science History Conference, no. Web, 
Web-Web. 2014; Matthew Brehmer et al., „Timelines revisited: A design space and considera- 
tions for expressive storytelling,“ IEEE transactions on visualization and computer graphics 23/9 
(2016): 2151-2164. doi: 10.1109/TVCG.2016.2614803; Marc Champagne, „Diagrams of the past: 
How timelines can aid the growth of historical knowledge,“ Cognitive Semiotics 9/1 (2016): 11- 
44. doi: 10.1515/cogsem-2016-0002. 

3 Ryan Eccles et al., „Stories in geotime,“ Information Visualization 7/1 (2008): 3-17. doi: 
10.1109/VAST.2007.4388992; Tiago Gongalves, Ana Paula Afonso und Bruno Martins, „Carto- 
graphic visualization of human trajectory data: Overview and analysis,“ Journal of Location 
Based Services 9/2 (2015): 138-166. doi: 10.1080/17489725.2015.1074736; Shakespear, Daniel. 
„Interactive Genealogy Explorer: Visualization of Migration of Ancestors and Relatives,“ in 
BD 2015, CEUR Workshop Proceedings, 2015, hg. v. Serge ter Brake et al., 94-100. 

4 Elisa Beshero-Bondar und Elizabeth Raisanen, „Recovering from Collective Memory Loss: 
The Digital Mitford’s Feminist Project,“ Women’s History Review 26/5 (2017): 738-750. doi: 
10.1080/09612025.2016.1166882; Theresia Biehl, Anne Lorenz, Dirk Osierenski und Exilnetz33, 
„Exilnetz33. Ein Forschungsportal als Such-und Visualisierungsinstrument, in Grenzen und 
Möglichkeiten der Digital Humanities (Zeitschrift für digitale Geisteswissenschaften, Sonder- 
band 1) (2015); Lonneke Geerlings, „A Visual Analysis of Rosey E. Pool’s Correspondence Archi- 
ves. Biographical Data, Intersectionality, and Social Network Analysis,“ in BD2015, CEUR 
Workshop Proceedings, 2015, hg. v. Serge ter Braake et al., 61-67; Maximilian Schich et al., 
„A network framework of cultural history,“ science 345/6196 (2014): 558-562. Patrick Schmitz 
und Laurie Pearce, „Humanist-centric tools for big data: berkeley prosopography services,“ in 
Proceedings of the 2014 ACM symposium on Document engineering, 179-188. ACM: 2014. 

5 Cristian Jara-Figueroa, Amy Z. Yu und César A. Hidalgo, „Estimating technological breaks in 
the size and composition of human collective memory from biographical data,“ Preprint auf 
https://arxiv.org/abs/1512.05020 (2015). Amy Zhao Yu et al., „Pantheon: visualizing historical 
cultural production,“ in 2014 IEEE Conference on Visual Analytics Science and Technology 
(VAST), 289-290. IEEE, 2014. 

6 Neil Armitage, „The biographical network method.“ Sociological Research Online 21/2 (2016): 
165-179. doi: 10.5153/sro.3827; Olivier Gergaud, Morgane Laouenan und Etienne Wasmer, „A 
Brief History of Human Time. Exploring a database of ‚notable people‘, “ (2017). Working pa- 
per, HAL Id: hal-01440325/; Eero Hyvönen et al., „BIOGRAPHYSAMPO-A Paradigm Shift for 
Publishing and Using Biography Collections on the Semantic Web,“ in ESWC 2019: The Seman- 
tic Web, 574-589. Cham: Springer; Richard Khulusi et al., „An interactive chart of biography,“ 
in 2019 IEEE Pacific Visualization Symposium (PacificVis), 257-266. IEEE, 2019; Christofer Mein- 


Visuelle Analyse und Kuratierung von Biographiedaten — 141 


Während diese Forschungsarbeiten den Möglichkeitsraum für die Visuali- 
sierung von biographischen Daten aufzeigen, so wurden diese bislang kaum 
mit prosopographischen Datensammlungen verknüpft und zu deren Erschlie- 
Bung und Vermittlung genutzt. Das möchten wir durch die laufende Methoden- 
und Technologieentwicklungen im H2020-Projekt InTaVia (In/Tangible Eu- 
ropean Heritage — Visual Analysis, Curation and Communication, https://inta 
via.eu) ändern: Das Projekt hat eine Verbesserung der Datenbasis und die Ent- 
wicklung eines visuellen Analysestudios für Daten und Themen des materiellen 
und immateriellen Kulturerbes zum Ziel (Abbildung 1). Die Basis des Projekts 
bildet die Schaffung einer europäischen und synoptischen Datenbasis durch (i) 
die Zusammenführung und Integration verschiedener europäischer National- 
biographien,’ (ii) deren Optimierung durch den Einsatz fortgeschrittener Natu- 
ral Language Processing-Verfahren, und (iii) deren Verknüpfung mit kulturellen 
Objektdatenbanken (zum Beispiel Europeana). Diese erweiterte Datenbasis, 
welche Informationen zu Leben und Werken zahlreicher europäischer Künstler: 
innen, aber auch anderer bedeutender Akteure enthalten wird, liefert das Aus- 
gangsmaterial für multiple Perspektiven der visuellen Analyse. Ausgehend von 
statischen Blicken auf die Sammlungen von individuellen Lebenswerken (inklu- 
sive Karten, Netzwerke und Mengendiagramme, Abbildung 1, Sektion 1a) sollen 
verschiedene Visualisierungstechniken mit einem Fokus auf die Zeitdimension 
(Abbildung 1, Sektion 1b) genutzt werden, um historische Lebenswege und da- 
mit verknüpfte kulturelle Objekte synoptisch zu analysieren (Abbildung 1, Sek- 
tion 2). Daneben wird auch die prosopographische Forschung visuell unter- 
stützt werden, indem aggregierte Gruppen von Personen und Objekten, die mit- 
einander in Relation stehen, gemeinsam analysiert werden können (Abbildung 
1, Sektion 3). 


ecke und Stefan Jänicke, „Visual Analysis of Engineers’ Biographies and Engineering Bran- 
ches,“ in LEVIA18: Leipzig Symposium on Visualization in Applications. 2018; Irene Russo, Tom- 
maso Caselli und Monica Monachini, „Extracting and Visualising Biographical Events from 
Wikipedia,“ in BD 2015, hg. v. Serge ter Braake et al., 111-115. CEUR Workshop Proceedings, 
2015; Schmitz und Pearce, „Humanist-centric tools for big data“. 

7 Die Kollaboration inkludiert die Nationalbiogaphie von Finnland mit dem digitalen Portal 
BiographySampo (https://seco.cs.aalto.fi/projects/biografiasampo/en/), das holländische Bio- 
graphyNet (http://www.biografischportaal.nl/en), das österreichische Austrian Prosopographi- 
cal Information System (https://apis.acdh.oeaw.ac.at/) und die slowenische Slovenska biogra- 
fia (http://www.slovenska-biografija.si/), Zugriff am 16.03.2021. 
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Abb. 1: Synoptische Visualisierung von materiellem Kulturerbe (kulturelle Objekte) und imma- 
teriellem Kulturerbe (Biographien) in InTaVia. Abbildung von Florian Windhager. 


Visualisierungen erleichtern es zudem, die Ergebnisse dieser Analysen an diver- 
se Zielgruppen zu kommunizieren. Neben Interfaces für Expert:innen, ermögli- 
chen es Storytelling-Methoden biographische Narrationen visuell auch für eine 
breite Öffentlichkeit aufzubereiten und leichter verständlich zu kommunizie- 
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ren.® Biographien als zeitliche Abfolge von Ereignissen eines Protagonisten sind 
in ihrem Kern bereits narrativ und legen daher eine solche Aufbereitung von 
kulturellen Informationen nahe. 


3 Visuelle Kuratierung von Biographiedaten 


Für eine effizientere Aufbereitung und strukturierte Annotation von biographi- 
schen Texten kommen in den letzten Jahren vermehrt Methoden des Natural 
Language Processing (NLP) zum Einsatz? — teilweise auch durch Verknüpfung 
mit weiteren offen zugänglichen Datenquellen’®. So wurde exemplarisch das 
Österreichische Biographische Lexikon (OBL) digitalisiert und mithilfe von NLP- 
Verfahren aufbereitet, sodass es nun als prosopographische Datenbank (Austri- 
an Prosopographical Information System, APIS)" zugänglich ist, die zu Perso- 
nen strukturierte, maschinenlesbare Informationen in der Form von Relationen 
mit Orten, Institutionen oder anderen Personen bietet. 

Diese Art der Datenaufbereitung durch Prozessierung von (manchmal be- 
reits im Original fehlerhaften)” historischen Textquellen durch stochastische 
NLP-Verfahren? erzeugt jedoch auch Datensätze, die zahlreiche Lücken, Fehler 
und Unsicherheiten aufweisen und die damit der qualitativen Korrektur, Anrei- 


8 Eva Mayr und Florian Windhager, „Once upon a spacetime: Visual storytelling in cognitive 
and geotemporal information spaces,“ ISPRS International Journal of Geo-Information 7/3 
(2018): 96. doi: 10.3390/ijgi7030096. 

9 John Bradley und Harold Short, „Texts into databases: The evolving field of new-style pro- 
sopography,“ Literary and linguistic computing 20 (2005): 3-24. doi: 10.1093/llc/fqi022; Antske 
Fokkens et al., „BiographyNet: Methodological Issues when NLP supports historical research,“ 
in LREC (2014), 3728-3735. 

10 Judith Brouwer und Harm Nijboer, „Golden Agents. A Web of Linked Biographical Data for 
the Dutch Golden Age,“ in Proceedings of the Second Conference on Biographical Data in a Digi- 
tal World 2017, hg. v. Antske Fokkens et al., 33-38. CEUR Workshop Proceedings, 2017; Petri 
Leskinen, Eero Antero Hyvönen und Jouni Antero Tuominen, „Analyzing and visualizing pro- 
sopographical linked data based on biographies,“ in Proceedings of the Second Conference on 
Biographical Data in a Digital World 2017 (BD2017), hg. v. Antske Fokkens et al., 39-44. CEUR 
Workshop Proceedings, 2018. 

11 Vgl. Matthias Schlögl und Katalin Lejtovicz, „A Prosopographical Information System 
(APIS),“ in BD 2017, hg. v. Antske Fokkens et al., 53-58. CEUR Workshop Proceedings, 2017. 
12 Vgl. Ágoston Zénó Bernäd und Maximilian Kaiser, „The Biographical Formula: Types and 
Dimensions of Biographical Networks,“ in BD 2017, hg. v. Antske Fokkens et al., 45-52. CEUR 
Workshop Proceedings, 2017. 

13 Zu deren Reliabilität vgl. auch Fokkens et. al., „BiographyNet, 3728-3735; Schlögl und Lej- 
tovicz, „Prosopographical Information System“. 
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cherung und Kuratierung durch Historiker:innen bedürfen. Gleichzeitig sind die 
Expert:innen, die eine fachlich fundierte Kuratierung der Daten vornehmen 
könnten, nicht zwingendermaßen auch diejenigen, die die Funktionsweise von 
NLP-Verfahren verstehen und so gezielt jene Datensätze identifizieren könnten, 
die besondere Aufmerksamkeit und Nachbesserungen benötigen. Auch in die- 
sen Fällen können visuelle Interfaces!“ Unterstützung bieten, um die Ergebnisse 
von NLP-Verfahren weniger technisch zu kommunizieren, die Aufmerksamkeit 
auf unsichere Ergebnisse dieser Verfahren zu lenken und so eine benutzer- 
freundliche Umgebung für die Kuratierung prosopographischer Daten bereitzu- 
stellen. Gleichzeitig können durch die Korrektur fehlerhafter Ergebnisse NLP- 
Verfahren in einem aktiven Lernprozess trainiert und damit optimiert werden. 

Im Kontext von InTaVia streben wir danach, die Korrektur, Anreicherung 
und Aufbereitung von Objekt- und Biographiedaten in einem eigenen Kuratie- 
rungs-Modul zu ermöglichen, welches eng mit dem visuellen Analysestudio ver- 
knüpft ist, um Kuratierungstätigkeiten auf textlicher und visueller Ebene zu er- 
möglichen (Abbildung 2): So können biographische Daten die durch NLP-ba- 
sierte, probabilistische Verfahren gewonnen werden - ebenso wie Metadaten 
von historischen Objektsammlungen - durch Visualisierung einer multimoda- 
len Qualitätskontrolle unterzogen werden und entsprechenden manuellen Kor- 
rekturen zugeführt werden — zum Beispiel durch die Hervorhebung von proba- 
bilistisch unsicheren Extraktionen, die besonderer Aufmerksamkeit durch Ex- 
pert:innen bedürfen. Die Visualisierung von Datenqualität, Unvollständigkeit 
und Unsicherheit bietet hierzu ein wachsendes Spektrum von Optionen.” Durch 
Markierung solch unsicherer Datenpunkte können neben Ansatzpunkten für 
manuelle Revision auch alternative NLP-Ergebnisse sichtbar gemacht werden - 
und damit Vorschläge für die fortgesetzte Kuratierung der Datenbasis unterbrei- 
tet werden. 


14 Steffen Koch et al., „VarifocalReader - in-depth visual analysis of large text documents,“ 
IEEE transactions on visualization and computer graphics 20/12 (2014): 1723-1732. doi: 10.1109/ 
TVCG.2014.2346677. 

15 Florian Windhager, Saminu Salisu und Eva Mayr, „Exhibiting uncertainty: Visualizing data 
quality indicators for cultural collections,“ Informatics 6/3 (2019): 29, doi: 10.3390/informa 
tics6030029. 
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Abb. 2: Konzept der visuell gestützten Kuratierung von Biographiedaten. Abbildung von Florian 
Windhager. 


4 Diskussion 


Mit Blick auf die Geschichte verschiedener historischer und geisteswissen- 
schaftlicher Disziplinen wirft die Entwicklung von digitalen prosopographi- 
schen Forschungsumgebungen auch Fragen der Interoperabilität mit traditio- 
nellen, hermeneutischen und interpretativen Ansätzen der Biographie- und 
Geschichtsforschung auf. Vor dem Hintergrund des etablierten historiographi- 
schen Methodenspektrums erscheinen prosopographische Datenbanken als 
zweierlei: als fachdienliche Werkzeuge auf dem neuesten Stand der Informati- 
onsmodellierung, wie auch als epistemisch riskante und methodisch experi- 
mentelle Blackbox-Systeme. Mit ihnen werden historische Informationen und 
Entitäten aus vormals rigiden syntaktischen Vernetzungen überlieferter Texte 
befreit und neu verfügbar für ein vielgestaltiges Spektrum von Abfragen, Analy- 
sen, Verknüpfungen und (visuellen) Transformationen. Laut zahlreicher Beob- 
achter:innen bereichern sie damit aber nicht nur das Methodenrepertoire der 
historischen Forschung, sondern remedieren und deformieren deren Prozesse 
in ebensolchem Ausmaß. Mit exemplarischem Fokus auf das kunstgeschichtli- 
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che Feld haben zum Beispiel Drucker'®, Schelbert”, und Bishop" diverse Aspek- 
te und Dimensionen aufgezeigt, in denen Digital Humanities-Technologien tra- 
ditionelle historiographische Standards und ihre komplexen interpretative und 
diskursiven Zielsetzungen verfehlen — oder ihnen noch nicht entsprechen. In 
diesem Kontext wird auch explizit auf die Bedeutung von benutzerzentriertem 
Design verwiesen, der angestrebte Nutzer:innen in den gesamten Entwicklungs- 
zyklus einbindet.! 

Vor diesem Hintergrund ergibt sich die zentrale Validierungsstrategie für 
die skizzierten Methoden und Technologien des InTaVia-Projekts aus seinem 
partizipativen Design-Ansatz und aus dem geplanten Aufbau eines ganzen Re- 
positoriums von kultur- und kunsthistorischen Fallbeispielen. Schon zu Beginn 
des Projekts wurden Expert:innen aus kunsthistorischer Forschung und prakti- 
scher Kulturvermittlung zu Workshops eingeladen, zu ihren Forschungsprakti- 
ken befragt und um Feedback zu den Konzepten und Komponenten der geplan- 
ten Plattform gebeten. Dies erlaubte einen unmittelbaren Abgleich von for- 
schungsgetriebenen Entwicklungszielen mit den Bedürfnissen von etablierten 
Praktiker:innen, sowie den Aufbau von multifokalen und differenzierten Ziel- 
gruppen-Definitionen. So konnten Nutzer:innen-Profile für diverse Praxisfelder 
abgeleitet werden, inklusive den Bereichen der Ausstellungskuratierung, des 
Sammlungsmanagements, der schulischen und musealen Vermittlung von Kul- 
tur und (Kunst-)Geschichte, der (digitalen) geisteswissenschaftlichen und histo- 
rischen Forschung, der Mediengestaltung im Bereich von Gedächtnisinstitutio- 
nen, der Fremdenführung, des Kulturtourismus und des Kulturjournalismus. In 
diesen unterschiedlichen Feldern sollen bereits im Laufe des Projekts gemein- 
sam mit praktischen und thematischen Expert:innen ein ganzes Repertoire von 
Fallstudien aufgebaut werden, um von den verschiedenen Fragestellungen, 
Praktiken, Ausgangsdaten und Zielsetzungen für die Anforderungen an die 


16 Johanna Drucker, „Is there a ‚digital‘ art history?“ Visual Resources 29/1-2 (2013): 5-13. doi: 
10.1080/01973762.2013.761106. 

17 Georg Schelbert, „Art history in the world of digital humanities. Aspects of a difficult rela- 
tionship,“ Kunsttexte.de 4 (2017): 1-10, https://edoc.hu-berlin.de/bitstream/handle/18452/ 
19404/Schelbert%20-%20final.pdf, Zugriff am 25.02.2022. 

18 Claire Bishop, „Against digital art history,“ International Journal for Digital Art History 3 
(2018): 121-131. 

19 Houda Lamgaddam et al., „When the tech kids are running too fast: Data visualisation 
through the lens of art history research," in Proceedings of the 3rd IEEE Workshop for Visuali- 
zation for the Digital Humanities (vis4dh), 2018, Berlin; Eva Mayr, Günther Schreder und Florian 
Windhager, „Digital HUMANities-Eine benutzerzentrierte Perspektive,“ in Digital Humanities 
im deutschsprachigen Raum (DHd 2018), Book of Abstracts, 2018, Köln. 


Visuelle Analyse und Kuratierung von Biographiedaten — 147 


Technologien zu lernen - und um unmittelbares Nutzer:innen-Feedback für die 
iterativen Zyklen der Technologieentwicklung zu generieren. 

Eine weitere Strategie zur Harmonisierung von digitalen und traditionellen 
geisteswissenschaftlichen Perspektiven wird sich aus der Sicherstellung von 
konsistenten Zugriffsmöglichkeiten auf originale Texte und Objekte ergeben. So 
soll gerade im Kontext einer multiperspektivischen „Distant Reading & 
Viewing“-Umgebung die Verfügbarkeit von „Close Reading“-Konstellationen 
Historiker:innen eine direkte Einsicht in den biographischen Quelltext ermögli- 
chen oder Kunsthistoriker:innen den Zugang zu einzelnen Werken und Objek- 
ten sichern. Entsprechende Benutzeroberflächen führen idealerweise die abs- 
trakten Optionen der digitalen Makroanalyse mit dem Potential der hermeneuti- 
schen Mikroanalyse zusammen und erlauben variable Zyklen von elastischer 
Exploration und skalierbarer Lektiire.”° 

Zu den wertvollsten Einsichten aus der ersten Feedback-Phase im Projekt 
gehörte auch die Erkenntnis der Bedeutung von individuellen Datenbeständen. 
Obwohl InTaVia durch die Zusammenführung von nationalen Datenbeständen 
(das heißt, den Nationalbiographien) und internationalen Aggregatoren (zum 
Beispiel Europeana) eine verhältnismäßig umfangreiche Datenbasis schaffen 
wird, argumentierten Forscher:innen und Praktiker:innen stringent für die Öff- 
nung der Analyseumgebung in Richtung lokaler Biographie- und Objektbestän- 
de. Vor diesem Hintergrund wurden Konzepte und Optionen für den Import von 
lokalen Daten gestärkt. Dies wird es zum einen möglich machen, zahllose regio- 
nale Biographien und Sammlungen visuell zu analysieren, zu kommunizieren, 
und mit einem größeren europäischen Kontext kulturgeschichtlicher Daten in 
Beziehung zu setzen. Zum anderen kann so auch lokal und effektiv den diver- 
sen Formen von Bias und von (kultur-)historischer Selektivität entgegengewirkt 
werden, welche sich über die historische Kanonisierung der „ausgezeichnetsten 
Maler, Bildhauer und Baumeister“ auch unübersehbar in digitale Datenban- 
ken eingeschrieben haben.” 


20 Vgl. Mark-Jan Bludau et al., „Reading Traces: Scalable Exploration in Elastic Visualizations 
of Cultural Heritage Data,“ Computer Graphics Forum 39/3 (2020): 77-87, doi: 10.1111/cgf.13964. 
21 Giorgio Vasari, The lives of the most excellent painters, sculptors, and architects (Überar- 
beitete Neuauflage, Original veröffentlicht um 1550) (Oxford, UK: Oxford University Press, 
2008). 

22 Katrin Glinka, Sebastian Meier und Marian Dörk, „Visualising the ‚Un-seen‘: Towards Cri- 
tical Approaches and Strategies of Inclusion in Digital Cultural Heritage Interfaces,“ Kultur und 
Informatik XIII (2015): 105-118; Roopika Risam, „Decolonizing the digital humanities in theory 
and practice,“ in The Routledge companion to media studies and digital humanities (London: 
Routledge, 2018), 78-86. 
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Visuelle Analyseumgebungen, wie sie im Forschungsprojekt InTaVia entwi- 
ckelt werden, können einen niederschwelligen Zugang zu prosopographischen 
Datenbanken bieten ohne deren Funktionsumfang einzuschränken. Dadurch 
werden neue Dimensionen (zum Beispiel Anzahl der Personen, die gemeinsam 
betrachtet werden können) und Möglichkeiten (zum Beispiel Verknüpfung mit 
weiteren Datenquellen, wie beispielsweise dem materiellen kulturellen Erbe) 
auch für nicht- oder post-digitale Historiker:innen erschlossen. Ein zentraler Er- 
folgsfaktor für die Akzeptanz solcher Technologien ist dabei die konstante Ein- 
beziehung der Zielgruppe(n) in den Entwicklungsprozess, da so nicht nur die 
Passung der Technologien mit nicht-digitalen Forschungsprozessen sicherge- 
stellt werden kann, sondern auch Einsichten in technologische Möglichkeiten 
und Grenzen zu erwarten sind, die für die wechselseitige Vermittlung von (digi- 
talen) Humanities-Praktiken produktiv gemacht werden können. 
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Digitale Prosopographie 


Die automatisierte Auswertung des Repertorium Germanicum, 
eines Quellenkorpus zur Geschichte geistlicher Eliten des 
15. Jahrhunderts 


Abstract: This paper presents a new approach to the automatic evaluation of 
the Repertorium Germanicum (RG), a collection of registers on late medieval 
German ecclesiastical history, based on modern compiler construction technol- 
ogy. The RG, which is very large by medieval standards, uses an elaborate sys- 
tem of abbreviations, which makes the contents of the records accessible in a 
summarised form. For the automatic evaluation of these registers, it is neces- 
sary to record the semantics of the compressed text. With ANTLR, a parser gen- 
erator for structured text from compiler construction, the individual compo- 
nents in the text can be identified by using a grammar. The creation of the 
grammar is explained with an example and its individual components are de- 
scribed. Subsequently, it will be considered how the results of such a parsing 
process can be used for the development of a general ontology for the prosopog- 
raphy of clerical elites, which will form the starting point for comprehensive 
data collection and its further analysis. 


Keywords: Repertorium Germanicum, Vatican sources, historical network ana- 
lysis, language processing, prosopography, Church history, Middle Ages 


Zusammenfassung: In diesem Beitrag wird ein neuer Ansatz zur automatischen 
Auswertung des Repertorium Germanicum (RG), eines Regestenwerks zur spat- 
mittelalterlichen deutschen Kirchengeschichte, auf der Basis moderner Compi- 
lerbau-Technologie vorgestellt. Um das fiir mittelalterliche Verhaltnisse sehr 
umfangreiche Quellenmaterial zu erschließen, verwendet das RG ein elaborier- 
tes System von Abkürzungen, auf dessen Basis die Inhalte der Akten kompri- 
miert dargestellt werden. Zur automatischen Auswertung dieser Regesten ist es 
notwendig, die Semantik des komprimierten Textes zu erfassen. Dafür wird 
ANTLR, ein Parsergenerator für strukturierten Text aus dem Compilerbau, ver- 
wendet, mit dem die einzelnen Bestandteile im Text mittels einer von uns entwi- 
ckelten Grammatik identifiziert werden können. An einem Beispiel werden die 
Erstellung der Grammatik erläutert und ihre einzelnen Bestandteile erklärt. Dar- 


3 Open Access. © 2022 Clemens Beckstein, Robert Gramsch-Stehfest, Clemens Beck, Jan Engelhardt, Chris- 
tian Knüpfer, Georg Zwillling, published by De Gruyter. [¢) Xa] Dieses Werk ist lizensiert unter einer 
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an schließen sich Überlegungen an, wie die Ergebnisse eines solchen Parserpro- 
zesses für die Entwicklung einer allgemeinen Ontologie zur Prosopographie 
geistlicher Eliten genutzt werden können, die die Ausgangsbasis für eine umfas- 
sende Datenerhebung und deren weitere Analyse bilden. 


Schlagwörter: Repertorium Germanicum, Vatikanische Quellen, Historische 
Netzwerkanalyse, Language Processing, Prosopographie, Kirchengeschichte, 
Mittelalter 


Denn auf diesem Ozean von Papier, wo keine Sterne den Weg zeigen, würde der suchende 
Forscher lange umherfahren können, ehe er die Inseln findet, von denen er nicht einmal 
mit Sicherheit voraussagen kann, ob sie überhaupt existieren. 

Johannes Haller (1903) 


Als der bekannte Mittelalter- und Papsthistoriker Johannes Haller 1892 frisch 
promoviert nach Rom kam, bewarb er sich am dortigen Königlich Preußischen 
Historischen Institut als „Hilfsarbeiter“ bei einem Projekt, das seine wissen- 
schaftliche Laufbahn mitbestimmen und dem er selbst seinen Stempel aufdrü- 
cken sollte, dem Repertorium Germanicum (RG).! In dieses „Verzeichnis der in 
den päpstlichen Registern und Kameralakten vorkommenden Personen, Kir- 
chen und Orte des deutschen Reiches“ sollten alle Aktenstücke aus dem kurz 
zuvor für die wissenschaftliche Forschung geöffneten Vatikanischen Geheimar- 
chiv Aufnahme finden, welche sich auf die deutsche Geschichte zwischen 1378 
und 1521 bezogen. Angesichts von tausenden dickleibigen Folianten, die sorg- 
sam auf deutsche Betreffe durchzusehen, zu exzerpieren und in Regestenform 
zu bringen waren, handelte es sich um eine wahre Mammutaufgabe. Und so 
veranlassten die Erfahrungen aus diesem Projekt den mittlerweile zum Marbur- 
ser Professor aufgestiegenen Haller elf Jahre später zu einer denkwürdigen Stel- 
lungnahme: 


1 Zur Person vgl. Benjamin Hasselhorn, Johannes Haller: Eine politische Gelehrtenbiographie: 
Mit einer Edition des unveröffentlichten Teils der Lebenserinnerungen Johannes Hallers (Göttin- 
gen: Vandenhoeck & Rupprecht, 2015), darin 47-57 zu seiner römischen Zeit. Die Geschichte 
des Editionsprojekts Repertorium Germanicum wird geschildert in: Dieter Brosius, „Das Reper- 
torium Germanicum,“ in Das Deutsche Historische Institut in Rom 1888-1988, hg. v. Reinhard 
Elze und Arnold Esch (Tübingen: Niemeyer, 1990), 123-165; dazu auch Brigide Schwarz, „Das 
Repertorium Germanicum: Eine Einführung,“ Vierteljahrsschrift für Sozial- und Wirtschaftsge- 
schichte 90 (2003): 429-440. Zur Benutzung des RG immer noch unentbehrlich: Walter Deeters, 
„Über das Repertorium Germanicum als Geschichtsquelle. Versuch einer methodischen Anlei- 
tung,“ Blätter für deutsche Landesgeschichte 105 (1969): 27-43. 
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Mit der Quelle, aus der hier geschöpft wird, kann sich für diese Zeit keine andere in der 
Welt messen, sie übertrifft an Umfang und Mannigfaltigkeit schlechterdings alles, was 
aus dem ausgehenden Mittelalter überhaupt bekannt ist. [...]. So reich der Inhalt, so 
schwierig ist der Zugang. Vor diesen rund 4000 Banden steht der einzelne Forscher ratlos 
und hiilflos da [...]. Hier kann man wohl finden, aber nicht suchen.” 


Scharfsinnig analysierte Haller, wie diese uniibersehbare Aktenfiille effizient 
für die Zwecke mediävistischer Forschung erschlossen werden könne. Sein vi- 
sionärer Vorschlag war, den Stoff über ein höchst platzsparendes Indizierungs- 
system zu erschließen, das an eine moderne Datenbank erinnert: „[...] was wir 
vor allem brauchen, ist ein alphabetischer Index. [...] Wird zu den Namen (Per- 
sonen und Orten) außer dem Datum auch noch mit kurzem Schlagwort die Na- 
tur der Erwähnung hinzugesetzt [...] so ersetzt für den weiteren Kreis der Benut- 
zer der Index die Regestensammlung.“? 

Extrem knappe, ja geradezu kryptische Regesten in der Quellensprache La- 
tein, die auf engstem Raum alle wichtigsten Informationen beinhalten, dazu 
umfangreiche Indices: Dieser Aufbau wurde zum „Markenzeichen“ des Reperto- 
rium Germanicum, das mittlerweile auch in die digitale Sphäre umgezogen ist 
(RG Online).* Für mediävistische Verhältnisse handelt es sich regelrecht um 
„Big Data“ und so stellt sich die naheliegende Frage, ob dieses Material auch 
mit fortgeschritteneren Technologien automatisiert erschlossen werden könnte. 
Denn solange das Material nur von Einzelforschenden lesend im Buch oder am 
Bildschirm rezipiert wird, gilt noch immer das Wort von Johannes Haller, dass 
„auf diesem Ozean von Papier [...] der suchende Forscher lange umherfahren“ 
muss.’ An dieser Stelle setzt unser Jenaer Forschungsprojekt Core-H (,,Collabo- 
rative Open Research Environment for the Humanities“) an, in dem sich die Er- 
schließung der RG-Regesten als Fallstudie (case study) in den breiteren Kontext 
der Entwicklung computergestützter Workflows für die historische Forschung 
einordnet.® 


2 Johannes Haller, „Über das Repertorium Germanicum, Gutachten (Marburg, 5.4.1903)“, Ar- 
chiv des DHI in Rom, Dienstakten A/8 (Acta generalia, Bd. VIII), 19 Bl., hier fol. 1. Zu dem 
Gutachten siehe auch Hasselhorn, Johannes Haller, 84-86. 

3 Haller, „Repertorium Germanicum,“ fol. 10. 

4 Zugang über die Website des „Romana Repertoria“-Online-Portals des DHI in Rom: http:// 
www.romana-repertoria.net/993.html, Zugriff am 06.10.2021. Vgl. dazu Jörg Hörnschemeyer, 
„Repertorium Germanicum Online“, in Friedensnobelpreis und historische Grundlagenfor- 
schung. Ludwig Quidde und die Erschließung der kurialen Registerüberlieferung, hg. v. Michael 
Matheus (Berlin: De Gruyter, 2012), 605-615. 

5 Haller, „Repertorium Germanicum,“ fol. 10. 

6 Vgl. die Projektwebsite unter https://www.mephisto.uni-jena.de/projekte/core-h sowie die 
Blogeinträge unter https://www.mephisto.uni-jena.de/blog, Zugriff am 06.10.2021. 
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Schauen wir uns einige typische Regesten aus dem RG Online (RG V) an - 
einen Ausschnitt aus der Pfriindenvita’ des Klerikers Johannes (Alberti) von 
Echte® aus den Jahren 1431 und 1437 (Abbildung 1). 


B RG V 04399 zur Merkliste hinzufügen 


Johannes de Echte Johannes (Alberti) de Echte Johannes de Eckt: l.b. iul. 1431 T 3 


25v. 


cler. Magunt. dioc.: de vicar. ad alt. ss. Laurentii, Cosme et Damiani atque Liberii in 
eccl. s. Crucis Northusen. Magunt. dioc. (4 m. arg. ) vac. p. resign. Johannis 
Wittenborn; n.o. disp. sup. def. nat. ( subdiac., c. ) 24. nov. 1431 S 272 81v. 

24. nov. 1431 


(...) 


pres. in R. cur.: de vicar. ad alt. ss. Andree et Nicolai in colleg. eccl. s. Crucis 
Northusen. Magunt. dioc. (5 m. arg. ) vac. p. resign. Hermanni Rulen presb. vel p.o. 
Johannis de Bendeleyben; n.o. vicar. in capel. s. Spiritus e.m. op. Duderstat d. dioc. (2 
m. arg. ), disp. sup. def. nat. ( subdiac., c. ) et quod pater ipsius J. cantor. c. can. et 
maior. preb. d. eccl. s. Crucis Northusen. obtin. 2. nov. 1437 S 341 224vs. 

2. nov. 1437 


Abb. 1: Ausschnitt aus der Pfriindenvita des Klerikers Johannes (Alberti) von Echte im RG V, Nr. 
4399 (Screenshot nach RG Online, RG IV 00133, URL: <http://rg-online.dhi-roma.it/RG/4/133> 
(Datum 14.10.2021)). 


Im ersten Sublemma finden wir den vollstandigen Namen des Geistlichen. Es 
folgt ein auf den 24. November 1431 datiertes Schreiben, in dem sich Johannes 
auf eine Vikarie am Altar St. Laurentius und weiteren in der Stiftskirche Heilig- 
kreuz Nordhausen bewirbt, welche nach seiner Angabe ein jährliches Einkom- 
men von vier Silbermark hatte. Weiter wird angegeben, dass die Pfründe durch 
den Verzicht (Resignation) eines gewissen Johannes Wittenborn frei (vakant) 


7 Pfründen sind mit konkreten Einkünften versehene kirchliche Ämter. 

8 Zu dessen Biographie vgl. Robert Gramsch, „Kurientätigkeit als ‚Berufsbild‘ gelehrter Juris- 
ten. Der Beitrag Roms zur Akademisierung Deutschlands im Spätmittelalter. Eine personenge- 
schichtliche Betrachtung,“ Quellen und Forschung aus italienischen Archiven und Bibliotheken 
80 (2000): 138-143. Eine Pfründenvita fasst alle Quellenbelege aus einem Pontifikat zusam- 
men, die einem bestimmten Kleriker als Bittsteller (sogenannter Petent) zuzuordnen sind. Die- 
selbe Person kann darüber hinaus auch in den Pfründenviten anderer Petenten genannt sein, 
etwa als Konkurrent in einem Prozess. Im RG Online können Personen, Orte und so weiter über 
eine Stringsuche gefunden werden, die allerdings wegen variierender Schreibweisen nicht 
treffgenau ist. 
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geworden war, und dass Johannes von Echte eine Geburtsdispens besaß, eine 
Ausnahmegenehmigung, Pfründen erwerben zu dürfen, obwohl er aus der Ver- 
bindung eines Subdiakons und einer verheirateten Frau hervorgegangen war.’ 
Das schließende Kürzel „S 272 81v“ gibt die Fundstelle im Vatikanischen Archiv 
an. 

Im Regest zum 2. November 1437 erfahren wir, dass sich Johannes von Ech- 
te damals am Papsthof (in Romana curia) aufhielt und dass er sich um eine wei- 
tere Altarvikarie in Nordhausen bewarb. Diese war durch den Pfründenverzicht 
eines gewissen Hermann Rulen frei geworden, sowie (zuvor) durch den Tod des 
Johannes von Bendeleyben. Nach einem Semikolon folgt das Kürzel „n.o.“, wel- 
ches den Beginn der sogenannten Nonobstanzenformel markiert, der Angabe, 
welche Pfründen Johannes von Echte bereits im Besitz hatte und deren Besitz 
dem Erwerb des erbetenen Altars nicht im Wege stehen sollte. Auch hier wird 
nochmals die Geburtsdispens genannt, diesmal konkretisiert durch die Angabe, 
dass Johannes’ Vater Kantor am Heiligkreuzstift war. 

Regesten dieser Art automatisiert beziehungsweise mit gewisser menschli- 
cher Hilfe semiautomatisiert auszuwerten, wird durch mehrere Umstände ent- 
schieden vereinfacht: Zum einen sind es immer wieder dieselben Gegenstände, 
die den Inhalt der Regesten ausmachen: Bittschriften, päpstliche Gratialschrei- 
ben und weitere Aktenstücke, die sich um den Erwerb von kirchlichen Ämtern 
und Einkünften drehen.! Schon im spätmittelalterlichen Verwaltungsbetrieb 
der kurialen Behörden herrschten hier bürokratische Effizienz und Routine, 
wenn mit den immer gleichen Rechtsformeln ähnliche Sachverhalte, bei denen 
nur die Namen der beteiligten Personen und zur Disposition stehenden Pfrün- 
den variieren, dokumentiert wurden. Der Inhalt dieser Schreiben lässt sich so- 
mit durch den modernen Bearbeiter recht einfach auf den wesentlichen Gehalt 
reduzieren, hinreichend charakterisiert durch einige hundert termini technici 
(wobei freilich so manches individualisierende Detail wegfällt, das erst der 
Blick auf das Originaldokument enthüllt). Mit dem entsprechenden kirchen- 
rechtlichen Hintergrundwissen lässt sich mithin aus vergleichsweise wenigen 
Worten, die zudem noch zu platzsparenden Abkürzungen ohne grammatikali- 
sche Finessen verkürzt worden sind, schon das Wesentliche erkennen. Das RG 
Online macht dieses Material digital abfragbar - allerdings durch den Flaschen- 


9 Zum Phänomen der Klerikerkinder, die wegen dieses „Geburtsdefekts“ (defectus natalium) 
einer päpstlichen Dispens bedurften, um in der Kirche Karriere machen zu können, vgl. Ludwig 
Schmugge, Kirche, Kinder, Karrieren: Päpstliche Dispense von der unehelichen Geburt im Spät- 
mittelalter (Zürich: Artemis, 1995). 

10 Zu diesem Phänomen vgl. etwa Brigide Schwarz, „Römische Kurie und Pfründenmarkt im 
Spätmittelalter,“ Zeitschrift für Historische Forschung 20 (1993): 129-152. 
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hals einer Suchmaske, die nur Einzelabfragen und ein relativ mühseliges Daten- 
sammeln per copy & paste erlaubt. Hat man hingegen die Regestentexte digital 
zur Verfiigung, so riickt die Méglichkeit eines automatisierten Information Re- 
trieval in greifbare Nahe. 

Gestützt auf den digitalen 10. Band (zum Pontifikat Sixtus’ IV. 1471-1484) 
haben wir 2019 eine erste „Probebohrung“ unternommen. Ihr Ziel war, jene Be- 
lege aufzufinden und automatisch auszuwerten, die den Geldtransfer zwischen 
Deutschland und Rom in Form der sogenannten Annaten zum Gegenstand ha- 
ben. Diese wurden fällig, wenn ein Kleriker auf päpstliche Verleihung hin eine 
geistliche Pfründe erhielt, deren ersten halben Jahresertrag er als Gebühr an 
den Papst zu entrichten hatte. Uns interessierte vor allem, welche individuellen 
und institutionellen Akteure (Bankhäuser, aber auch Kurienpersonal) an diesen 
Transfers beteiligt waren. Eine solche Forschungsaufgabe wäre früher nur mit 
hohem Aufwand zu lösen gewesen, denn es hätte endlosen Nachschlagens in 
der Edition und einer peniblen Listenführung bedurft, um allein die Daten zu 
erheben. Unser Workflow ermöglichte es hingegen, die einschlägigen Regesten 
automatisch aus der Stoffmasse des RG herauszufiltern. Dafür wurden die Ein- 
träge in der TUSTEP-Datei des RG-Bandes mit einem Python-Skript nach der Zei- 
chenkette „solv. pro annat.“ durchsucht. Zu einer so gefundenen Annatenzah- 
lung wurden dann das Datum des Vorgangs, die Regestennummer sowie der 
Auftraggeber der Zahlung aus dem Lemma extrahiert. Weiterhin wurden der 
Übermittler der Zahlung, die zur Disposition stehende Pfründe und die Gebüh- 
renhöhe ermittelt. Diese Daten wurden zur weiteren Verarbeitung in eine CSV- 
Datei geschrieben. Mit der Programmiersprache R wurde anschließend das Per- 
sonennetzwerk der Annatenzahlungen analysiert und visualisiert. Die Knoten 
in einem solchen Netzwerk sind die historischen Personen, eine gerichtete Kan- 
te verbindet den Gebührenzahler mit dem involvierten Finanzakteur (ein Bank- 
haus oder auch eine konkrete Person). Über Zentralitäts- und Clusteranalysen 
konnten so die wichtigsten Agenten in diesem Netzwerk identifiziert und Struk- 
turmuster des damaligen kurialen Finanzsystems herausgearbeitet werden." 

Freilich hat sich der hier eingeschlagene Weg, über regular expressions den 
Inhalt der Lemmata zu erschließen, als problematisch für komplexere Auswer- 
tungen erwiesen. Benötigt wurde ein digitales Werkzeug, das in der Lage ist, 
die charakteristische Struktur eines jeden Regestentyps eindeutig zu identifizie- 
ren und dafür in einem ersten Schritt der späteren digitalen Auswertung einen 
kodierenden Parsebaum zu generieren. Eine Grammatik im informatischen Sin- 


11 Vgl. hierzu Robert Gramsch-Stehfest, „Von der Metapher zur Methode: Netzwerkanalyse als 
Instrument zur Erforschung vormoderner Gesellschaften,“ Zeitschrift für Historische Forschung 
47 (2020): 20-28. 
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ne bildet dabei alle Optionen ab, in der ein bestimmter Regestentyp ausgeformt 

sein kann. Der Prozess der Erstellung einer solchen Grammatik setzt einen en- 

gen Feedbackloop zwischen den daran zwingend beteiligten Historiker:innen 
und Informatiker:innen voraus. Für die Erstellung unserer RG-spezifischen 

Grammatik und die sich darauf stützende Extrahierung der Informationen aus 

dem Text nutzen wir seit dem Frühjahr 2021 mit bemerkenswertem Erfolg 

ANTLR (ANother Tool for Language Recognition)”, ein ursprünglich für den 

Compilerbau entwickeltes, sehr mächtiges Werkzeug zur schnellen und komfor- 

tablen Implementierung domänenspezifischer Sprachen (DSLs), die sich über 

eine formale Grammatik charakterisieren lassen, also zum Beispiel von Pro- 
grammiersprachen, Datenbeschreibungssprachen, Interpretern oder Textanaly- 
se- und Texttransformationswerkzeugen jedweder Art. 

ANTLR ist ein Programmgenerator, der mit Hilfe des rekursiven Abstieges, 
passend zu einer vorgegebenen Grammatik einen top-down Parser, also das ei- 
gentliche, später für die Textanalyse eingesetzte digitale Werkzeug erzeugt.” 
Bei diesem Verfahren kommt jedem Nichtterminalsymbol der Grammatik eine 
(von ANTLR automatisch generierte) Prozedur zu, die die Grammatikregel zu 
diesem Symbol für die (gegebenenfalls rekursive) Konkretisierung des zu die- 
sem Symbol gehörenden Unterbaums im generierten Parsebaum benutzt. Die 
digitale Analyse und Transformation von strukturierten Texten (DSLs im oben 
genannten Sinne) erfolgt mit und durch ANTLR grob vereinfacht in drei aufein- 
anderfolgenden Schritten: 

1. Es wird eine lexikalische Analyse des Textes vorgenommen, das heißt im 
Eingabetext werden die von der Grammatik zugelassenen elementaren 
Textbausteine (die Tokens, das heißt die „Wörter“ der von der Grammatik 
implizit definierten formalen Sprache) identifiziert, die dann im weiteren 
Analyseprozess die Grundlage für die Konstruktion von Parsebäumen bil- 
den. 

2. Der von ANTLR automatisch generierte Parser startet den Prozess der 
schrittweisen Parsebaumgenerierung, indem er die Prozedur zu derjenigen 
Grammatikregel aktiviert, die nach Einschätzung von ANTLR den größt- 
möglichen Teil des Eingabetextes bestmöglich abdeckt. Die von ANTLR er- 


12 Siehe https://www.antlr.org/. 
13 Vgl. Alfred V. Aho, Ravi Sethi und Jeffey D. Ullman, Compilers. Principles, Techniques, and 
Tools (Reading, Massachusetts et al.: Addison-Wesley, 1986). 
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zeugten Parser verwenden dafiir die ALL(*) Parsertechnik, die Terence Parr, 
der Entwickler des Werkzeuges, zusammen mit Sam Harwell entwickelte. 

3. ANTLR baut nach von Nutzenden vorgebbaren Transformationsregeln (un- 
ter anderem iiber sogenannte tree-walker, siehe zum Beispiel Abbildung 3 
unten) den im zweiten Verarbeitungsschritt berechneten ,,besten“ Parse- 
baum im Rahmen einer automatischen Traversierung in eine Form um, die 
für die weitere domänenspezifische Nutzung, Analyse und Visualisierung 
der in dem Baum kodierten Informationen optimal ist. 


Diese fiir ANTLR typische Untergliederung des Verarbeitungsprozesses in drei 
jeweils fiir sich getrennt spezifizierbare Verarbeitungsschritte gestattet es, die 
eigentliche Analyse der Quelle weitgehend unabhängig von den sich daran an- 
schließenden, domänenspezifischen digitalen Nutzungen des Analyseergebnis- 
ses zu halten: Ein und dieselbe ANTLR-Grammatik lässt sich so für die unter- 
schiedlichsten Auswertungen von Quelltexten nutzen, sofern diese Texte nur 
korrekt durch diese Grammatik beschrieben werden. Und man ist bei diesem 
Ansatz nicht nur frei darin, welche Art von weitergehender Nutzung der von 
ANTLR generierten, sprachspezifischen Analyseergebnisse man realisieren 
möchte, sondern auch darin, wie man diese Nutzung unter Verwendung der da- 
für gegebenenfalls vorhandenen Werkzeuge und Infrastrukturelemente (Ziel- 
programmiersprachen, Visualisierer, Nonstandard-Datenbanken, Plattformen 
und vieles mehr), konkret realisiert. ANTLR ermöglicht so auf eine unkompli- 
zierte und gerade auch für Nicht-Informatiker:innen nachvollziehbare Weise 
eine komfortable Entwicklung vergleichsweise komplexer sprachtechnologi- 
scher Werkzeuge. 

Der für Anwender:innen herausforderndste Schritt in diesem Entwicklungs- 
prozess ist natürlich die Identifikation der für die beiden ersten Verarbeitungs- 
phasen benötigten Grammatik. Denn diese muss für die ersten beiden, primär 
quellenabhängigen Verarbeitungsschritte die Struktur der zu analysierenden 
Quelltexte angemessen charakterisieren. In unserem konkreten Anwendungs- 
fall erfordert das insbesondere die Ausdifferenzierung der einzelnen Regesten- 
typen, eine Aufgabe, die hauptverantwortlich durch Historiker:innen vorge- 
nommen wird. Eine notwendige Voraussetzung dafür ist die genaue Kenntnis 
des Repertorium Germanicum und seiner standardisierten Abkürzungen sowie 
der Syntax und Semantik der Regesten selbst. Historiker:innen müssen dafür 
wissen, welche Abkürzungen zu welchem Rechtsakt gehören und welche von 
uns so genannten „Markerworte“ den entsprechenden Vorgang kennzeichnen. 


14 Terence Parr, Language Implementation Patterns, (Dallas, Texas et al.: Pragmatic Books- 
helf, 2010). 
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Beispielsweise steht im dritten Band des RG ein solv. immer am Anfang einer 
Annatenzahlung oder ein prov. super immer am Anfang einer Provision (das 
heißt der Verleihung einer kirchlichen Pfründe durch den Papst). 

Über ein systematisches Studium der Viten müssen zu Beginn des Prozesses 
zur Erstellung von Grammatikregeln nicht nur die Regelmäßigkeiten im Aufbau 
eines bestimmten Regestentyps herausgearbeitet werden, sondern auch, welche 
Anteile bei Vorliegen dieses Typs optional sind. Mittels einer Suche nach Mar- 
kerworten im RG Online lässt sich dafür zunächst eine Auswahl von Regesten 
zusammenstellen, die zur gleichen Kategorie gehören. Dann lassen sich Regel- 
mäßigkeiten innerhalb dieser Regesten identifizieren und mögliche variierende 
Ausprägungen ermitteln. 

Erst durch das Zerlegen vieler gleichartiger Einträge nach dem gleichen 
Schema wird offensichtlich, welche Bestandteile dieses Schemas in den Reges- 
ten optional und welche obligatorisch sind. Auch hier ist historisches Wissen 
notwendig, um konkrete Abkürzungen, die an bestimmten Stellen eines Eintra- 
ges auftreten können, korrekt zu interpretieren. Beispielsweise können bei einer 
Provision nach dem Markerwort prov. de eine Pfarrkirche (par. eccl.) oder ein 
Kanonikat mit Pfründe (can. et preb.) stehen. Dies bedeutet, dass an jener Stelle 
wahrscheinlich alle Arten von kirchlichen Pfründen auftreten können. Anstatt 
nun in einer Grammatikregel alle möglichen Pfründen an jeder Stelle ihres Auf- 
tretens in der Grammatik aufzuzählen, wird für die Grammatik besser eine eige- 
ne Kategorie „Pfründe“ definiert, unter die sich unter Heranziehung des Abkür- 
zungsverzeichnisses des RG Online alle Abkürzungen subsumieren lassen, die 
in diese Kategorie fallen. 

Im nächsten Schritt wird die Grammatik anhand von weiteren Sublemmata 
getestet, die bei der eigentlichen Entwicklung der Regeln noch nicht in Betracht 
gezogen wurden, jedoch mit dem gleichen Markerwort beginnen. Immer wenn 
die Grammatik nicht in der Lage ist, das entsprechende Sublemma in einem 
Teilbaum korrekt abzubilden, müssen Anpassungen (ein debugging) der Gram- 
matik vorgenommen werden. Im einfachsten Fall muss dazu nur eine bestimm- 
te Ausprägung in einer schon bestehenden Kategorie ergänzt werden, in kom- 
plexeren Fällen muss die entsprechende Regel für einen Vorgangstyp grund- 
sätzlich alteriert werden. 

Im Folgenden wollen wir dies an einem Beispiel, nämlich dem oben bereits 
vorgestellten ersten Sublemma der Vita des Johannes von Echte (Abbildung 1) 
demonstrieren. 

In einer mit XML (Extensible Markup Language) ausgezeichneten Version 
wird dieses Regest wie folgt dargestellt: 
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<lemma id="10504399" spStart="" spEnd=""><reg> 
<head> Johannes de Echte Johannes (Alberti) de Echte </head> 


<sublemma vol="5"> Johannes de Eckt: <abk ref="415">1.b.</abk> <date 
norm="14310700" year="1431">iul. 1431</date> <fund norm="T:3:25v" 11="T" 
12="3" 13="25v">T 3 25v</fund>.</sublemma> 


<sublemma vol="5"><abk ref="202">cler.</abk> <abk ref="33">Magunt. 
</abk> <abk ref="296">dioc.</abk>: de <abk ref="792">vicar.</abk> ad <abk 
ref="109">alt.</abk> <abk ref="726">ss.</abk> Laurentii, Cosme et Da- 
miani atque Liberii in <abk ref="312">eccl.</abk> <abk ref="671">s.</abk> 
Crucis Northusen. <abk ref="33">Magunt.</abk> <abk ref="296">dioc.</abk> 
(4 <abk ref="438">m. arg.</abk>) <abk ref="787">vac.</abk> <abk 
ref="521">p.</abk> <abk ref="658">resign.</abk> Johannis Wittenborn; 
<abk ref="468">n.o.</abk> <abk ref="297">disp.</abk> <abk ref="743">sup. 
</abk> <abk ref="267">def.</abk> <abk ref="469">nat.</abk> (<abk 
ref="732">subdiac.</abk>, <abk ref="166">c.</abk>) <date 
norm="14311124" year="1431">24. nov. 1431</date> <fund norm="S:272:81v" 
11="S" 12="272" 13="81v">S 272 81v</fund>.</sublemma> 


Deutlich erkennbar ist eine Differenzierung nach Head und mehreren Sublem- 
mata. Im Head stehen Angaben zu dem Antragsteller. Handelt es sich um eine 
natiirliche Person (und nicht beispielsweise um eine juristische Person wie ein 
Kloster oder ein Domkapitel), dann werden regelmäßig ihr Name und gegebe- 
nenfalls weitere individualisierende Angaben wie beispielsweise der akademi- 
sche Grad und die absolvierten Studienfacher, ihr Weihegrad, eine Ordenszuge- 
hörigkeit oder weltliche und geistliche Ämter, die die Person bekleidet, ge- 
nannt. Diese persönlichen Angaben fassen wir in der Grammatik unter einer 
Regel mit dem (noch vorläufigen) Namen „Vita“ zusammen. In der ANTLR- 
Grammatik kann unsere Vita-Regel wie folgt Ausprägungen festlegen, die ihrer- 
seits wieder über speziellere Unterregeln zu charakterisieren sind: 


vita : ehestand? (funktion | inkardination | akadGrad | kirchAmt | herkunft 


| stand | orden | familienstand | pfruende | kardinal | titel )+ 


Bei unserem Beispiel Johannes de Echte sind diese einleitenden biographischen 
Informationen sehr überschaubar. Angesichts der fehlenden biographischen 
Angaben im Head konzentrieren wir uns im Folgenden auf eine genauere Erläu- 
terung des Sublemmas. Ein solches Sublemma wird in ANTLR zum Beispiel wie 
folgt dargestellt: 
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sublemma : SUBLEMMATAG vita? person? abks? 


(provision | annatenVerkehr | dispense | gunstGP | schutzbrief | nachfolge 
| eid | expektanz | verlaengerung | nonObs | ausstellung | erlaubnis | 
gruendung)+ 


(date | fund)+ CLOSESUBLEMMATAG ; 


Hier ist zunächst einmal allgemein festgehalten, dass in einem Sublemma bio- 
graphische Informationen zum Petenten (im obigen Sinne), eine (weitere) Per- 
son oder eine Abkürzung auftreten können. Anschließend folgen in ihm regel- 
mäßig einer oder auch mehrere der im RG vorkommenden Rechtsvorgänge. 
Dies wird im Sublemma durch das „+“ hinter dem geklammerten Ausdruck si- 
gnalisiert, der die jeweils möglichen Ausprägungen des Sublemmas durch ein 
„|“ (es steht logisch für ein „oder“) voneinander getrennt aufzählt. Abgeschlos- 
sen wird jedes solche Sublemma durch Tokens des Typs Datum und Fundstelle. 
Da es sich um eine Arbeitsversion des Parsers handelt, ist diese Liste bei Wei- 
tem noch nicht vollständig. Endziel ist es, alle möglichen (respektive die häufi- 
gen) Ausprägungen von Sublemmata in jeweils eigenen Kategorien fassen zu 
können. 

Das erste Sublemma der Vita Johannes von Echtes beinhaltet eine Provisi- 
on. Bei dem Beispiel handelt es sich um eine „normale“ Provision, daher kürzen 
wir sie mit „nProvision“ ab. Ihr Sublemma ist wie folgt aufgebaut: 


nProvision: intro (pfruende acquType? Schatzwert?)+; 


Eine normale Provision erwähnt also nach dem typischen Intro, das im 5. Band 
des RG nur aus „de“ besteht, eine Pfründe, einen optionalen Erwerbstyp (,,Ac- 
quType“, das nachgestellte „?“ signalisiert, dass er auch fehlen kann) und den 
optionalen Schätzwert der Pfründe. Das „+“ nach dem geklammerten Ausdruck 
zeigt wieder an, dass sich der eingeklammerte Teil mehrmals wiederholen und 
dadurch beispielsweise auch der Schätzwert vor dem Erwerbstypen stehen 
kann. Die Erwerbstypen sind selbst wieder ausdifferenziert, je nachdem um 
welche Arten von Pfründen es sich handelt. 

Da sich Johannes von Echte um Altäre bewarb, leitet ANTLR den entspre- 
chenden Teil der Regesten korrekt mit der Regel für Altar-Pfründen ab. Diese 
haben wir wie folgt definiert: 


pfruendenAlt : altarIntro (patroName | ’et’ | ’atque’)* #’situm’? instType 
patroName? location; 
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Das Altar-Intro kennzeichnet dabei die verschiedenen möglichen Stellen wie 
zum Beispiel die Altarvikarie (oder das Fehlen einer konkreten Angabe, wenn 
sich direkt um den Altar beworben wurde): 


(’<abk ref="791">vic.</abk>’ | ’<abk ref="792">vicar.</abk>’)? ’ad’? 
(’<abk ref="109">alt.</abk>’ | ’altare’) 


Deutlich zu sehen ist, dass im RG nach einem Altar-Intro ein Patrozinium (oder 
mehrere durch et oder atque verbundene Patrozinien) des Altars sowie die Insti- 
tution (in der Regel eine Kirche), in der der Altar gelegen ist, stehen kann. Diese 
Institution kann auch selbst tiber ein Patrozinium verfiigen, wobei die Optiona- 
lität wieder durch das nachgestellte „?“ signalisiert wird. Der Institution folgen 
dann der Standort und die Diözese, was wir in unserer ANTLR-Grammatik in ei- 
ner sogenannten Location-Regel zusammengefasst haben. Zuletzt muss der 
Schätzwert der Pfründe charakterisiert werden, um die Definition zu vervoll- 
ständigen. Unserer Regel zufolge besteht er nur aus einem Integer-Wert und ei- 
ner durch XML-Tags ausgezeichneten Abkürzung für eine Währung: 


schätzwert : INT? 

(’<abk ref="354">f1.</abk>’ 

’<abk ref="716">sol.</abk>’ 

’<abk ref="277">den.</abk>’ 

’<abk ref="354">f1.</abk> Renen.’ 
’<abk ref="368">gr.</abk>’ 

’<abk ref="438">m. arg.</abk>’ 
’fl’) 


Nach dem Schätzwert folgt entsprechend unserer Grammatikregeln der Er- 
werbstyp. Die im Beispiel des Johannes von Echte genannte Vakanz durch Resi- 
gnation des Vorbesitzers, Johannis Wittenborn, ist nur eine mögliche Erwerbs- 
Ausprägung. Weitere Vakanzgründe umfassen beispielsweise den Tod oder die 
Absetzung des Vorbesitzers; die Möglichkeit, dass der Vorbesitzer die Pfründe 
mit dem Antragsteller getauscht hat; die Heirat des Vorbesitzers, womit er aus 
dem geistlichen Stand ausgeschieden war; oder sogar, dass die Gründe der Va- 
kanz unbekannt sind. 

Nach dem Namen des Vorbesitzers können in einem Regest zusätzliche per- 
sönliche Informationen zu dieser Person stehen, beispielsweise deren Ordens- 
zugehörigkeit oder weitere Pfründen und Ämter, die der Vorbesitzer bekleidet. 
Eine weitere wichtige (kirchenrechtlich und damit historisch relevante) Infor- 
mation ist der sogenannte Kurien-Status der Pfründe, da das Besetzungsrecht 
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auf Pfriinden, die während eines Aufenthaltes des Vorbesitzers in Rom frei ge- 
worden waren, exklusiv beim Papst lag. 


acquType: (tausch | tod | verzicht | klostereintritt | hochzeit | 
translation | absetzung | uebertritt | befoerderung | widerruf | unbekannt 
) natPerson ((’de’ | ’ad’) (orden | pfruende))? kurienStatus? (’ seu’ 


acquType)? /ximAngesicht?x/; 


Ebenfalls zu beriicksichtigen sind die unterschiedlichen Tempora fiir das Frei- 
werden der Pfriinde. Im Beispiel des Johannes von Echte handelt es sich auf- 
grund der Formel ,,vac. p. resign.“ um einen Verzicht in der Gegenwart (,,ver- 
zichtistfrei“). 


verzichtistfrei: ’<abk ref="787">vac.</abk>’? (’per’ | ’per.’ | p. | 
’post’)? ’<abk ref="658">resign.</abk>’ ; // 


Nach dem Erwerbstyp folgt in dem ersten Beispiel von Johannes von Echte das 
Kürzel „n.o.“, was den Beginn der Nonobstanzenformel markiert. Als Non- 
obstantien werden in der Regel vor allem Pfründen genannt, die der Petent be- 
reits im Besitz hat. Hierfür enthält unsere Grammatik aus den vorab genannten 
Gründen bereits die entsprechende Kategorie „pfruende“. Als weitere mögliche 
Kategorie treten die Dispense hinzu — im vorliegenden Fall die Geburtsdispens. 
Somit lautet eine naheliegende Grammatikregel für die Nonobstanzenformel: 


nonObs : ’<abk ref="468">n. 0.</abk>’ (’et’)? (pfruende | dispense))+’; 


Der auf der Basis dieser Grammatik durch ANTLR nach den ersten beiden Verar- 
beitungsschritten generierte Baum sieht wie folgt aus: 
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—</lemma> 
| __.<jreg> 


pP —</sublemma> 


L—<fund_norm=527281v_1=5_12=272_13=81v> 


<date> 


c 1431 
[dat ass 
}———-.nov2a 


IL x =14311124 year=1431> 


<abk_rof=460>nat.</abk> 
defektit = 

eteko abe ret=267 adel fabio 
p dispense——defDispend 


ENA U intropispen: 


m <abk_ref=743>sup.</abk> 


|___.<abk_ref=297>disp.</abk> 
|___.<abk_ref=468>n._o.</abk> 


A natPersonID- ‚personName. Wittenborn 
1 Johannis 


-———-acqulypa m <abk ref=658>resign.<jabk> 


riche erzichtistfrei abk_ref=521>p.</abk> 


|__.cabk_ref=787>vac.</abk> 


<abk_ref=438>m._arg.</abk> 
4 


bistuemer 
[cater 
‚stadt ———+Northusen. 


crucis 
|___.<abk_ref=671>s.</abk> 


—schaetzwer —waehrung 


sregeste. 


;+<abk_ref=33>Magunt.</abk> 


|-_—~+patronamef 


p instTypeHaupt——<abk_ref=312>eccl.</abk> 
[provision ——mProvisio: -———rinst Type} 


Fs 
[-———?Prruende——piruenden ltl atrowame-————-Liberii 


patroName. Dam 
et 
-———-cosme 
patroNam Laurentii 


|__.cabk_ref=726>ss.</abk> 


p <abk ref=109>alt.</abk> 


(_ajtarintrg¢ ———ad 


L__eabk ref=792>vicar.</abk> 


1 +mintro——+e 

p <abk _ref=296>dioc.</abk> 
jocation—bistuemer 

| nits —intarinatio U —diocabks ——<abk_ref=33>Magunt.</abk> 


1 weihegrad+<abk_ref=202>cler.</abk> 


|___.<sublemma_vol=5> 


<head> 
m stadt—tEchte 
head ‚person. natPerson natPersoniD- personNams de 
|___Johannes 
<head> 
<reg> 


——<iemma_id=10504399_spStart=_spEnd=> 


Abb. 2: ANTLR-Baum des ersten Sublemmas der Pfründenvita des Klerikers Johannes (Alberti) 
von Echte (RG V 4399) 


Abgesehen von einem kleinen, noch unaufgelösten Bestandteil (erst das RG V 
erhält erläuternde Angaben zur Geburtsdispens, dass nämlich der Vater Subdia- 
kon, die Mutter eine verheiratete Frau — c[oniugata] — war), ist es uns also ge- 
lungen, mit Hilfe unserer anhand vom 3. Band entwickelten Grammatik alle Be- 
standteile des Sublemmas aus dem RG V inhaltlich sinnvoll mit dem von ANTLR 
dafür generierten Textanalysetool zu parsen. Den dabei entstandenen Parse- 
baum ließen wir dann noch im Rahmen des (hier nicht dargelegten) dritten Ver- 
arbeitungsschrittes von ANTLR visualisieren und nach XML transformieren, wo- 
durch die in ihm kodierten Informationen sowohl für vertiefte algorithmische 
Auswertungen als auch generell für eine funktionale Erweiterung der RG On- 
line-Version zur Verfügung stehen. 

Die Entwicklung einer ANTLR-Grammatik für die RG-Regesten stellt bei ei- 
nem geschickten Design der dafür gewählten Regelverfeinerungsstruktur quasi 
als „Nebenprodukt“ ein strukturiertes Begriffsgebäude zur Verfügung, um die 
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im Repertorium Germanicum enthaltenen biographischen und anderen Informa- 
tionen in inhaltlich angemessener Weise kategorial zu ordnen und zu repräsen- 
tieren. Das Spezialwissen von Historiker:innen, wie bestimmte Quellenbefunde 
zu lesen und auszudeuten sind, wird somit explizit in das Datenmaterial inkor- 
poriert, was dessen weitergehende Analyse nach unterschiedlichsten Fragestel- 
lungen gestattet. Ein Sublemma wie zum Beispiel das in der Vita des Johannes 
von Echte zum 2. November 1437 überlieferte, kann dann in ganz verschiedener 
Hinsicht personen- und institutionengeschichtlich oder auch netzwerkanaly- 
tisch ausgewertet werden (Abbildung 3). 


pres. in R. cur.: de vicar. ad alt. ss. Andree et Nicolai in colleg. eccl. s. Crucis Aus der Vita des 
Northusen. Magunt. dioc. (5 m. arg. ) vac. p. resign. Hermanni Rulen presb. vel p.o. 

Johannis de Bendeleyben; n.o. vicar. in capel. s. Spiritus e.m. op. Duderstat d. dioc. (2 Johannes von Echte 
m. arg. ), disp. sup. def. nat. ( subdiac., c. ) et quod pater ipsius J. cantor. c. can. et im RG v 


maior. preb. d. eccl. s. Crucis Northusen. obtin. 2. nov. 1437 S 341 224vs. 
2. nov. 1437 


Vorgänger Vorgänger 


-.-...- Hermann Rulen = - - —- — 


Inhaber (resigniert 
die Pfründe vor dem 
2.11.1437) 


Joh. de Echte 


Bewirbt sich auf 
Pfründe (2.11.1437) 


Joh. de 
Bendeleyben 


Inhaber (verst. einige 
Zeit vor dem 2.11.1437) 


Personeninformationen vicar. ad alt. ss. Andree et Nicolai in 

Name: Joh. de Echte colleg. eccl. s. Crucis Northusen. 

Status: cler. [Kleriker] Magunt. dioc. 

Herkunftsdiöz.: Mainz 

akad. Grad: bacc. in art. geogr. Informationen aufgeschlüsselt: 
bes. Merkmale: def. nat. Ort: Nordhausen, in: Mainzer Diözese 
(Sohn eines Subdiakons) Kirche: Hlg. Kreuz (Kollegiatstift) 
Pfründenbesitz / -ansprüche: Stelle: Vikarie / Altar 

Links auf versch. kirchl. Stellen Patronat: St. Andreas und Nikolaus 


Abb. 3: Unterschiedliche Informationen aus einem Sublemma der Vita des Johannes von Echte 
(RG V 4399) 


Die Abbildung zeigt, wie umfangreich und komplex die Sachverhalte sind, die 
schon in einem einzigen von zigtausenden RG-Einträgen dokumentiert sind. 
Diese Informationen möglichst erschöpfend automatisiert aus der Quelle her- 
auszulesen, ist die Herausforderung, vor der wir stehen. Ermöglicht werden 
wird dies aber erst durch eine Ontologie, die nicht nur die entsprechenden ter- 
mini technici enthält, sondern auch Abhängigkeiten zwischen diesen Begriffen 
beschreibt; damit kann sie einerseits als ein standardisiertes Vokabular dienen 
und andererseits interessante Arten von Schlussfolgerungen auf den Quelltex- 
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ten ermöglichen.” So ist es letztlich ein Fernziel unseres Core-H-Projektes, ex- 
emplarisch eine auf die Themenstellung der Prosopographie spätmittelalterli- 
cher gelehrt-klerikaler Eliten spezialisierte Ontologie zu entwickeln, die aus 
Gründen der Generalisierbarkeit und Verknüpfbarkeit mit anderen Datenbe- 
ständen als Spezialisierung entsprechender Konzepte des bekannten CIDOC- 
CRM-Standards formalisiert ist. Diesem Ziel sind wir durch die Arbeit an der 
ANTLR-Grammatik bereits ein gutes Stück nähergekommen. 

All dies ist beileibe kein einfacher Stoff. Es gibt eine Reihe von Spezialauf- 
sätzen, die man studieren muss, wenn man die Regesten des Repertorium Ger- 
manicum richtig lesen und verstehen will. Die Herausforderung, dieses Wissen 
in ein digitales Begriffs- und Regelsystem zu überführen, ist entsprechend groß. 
Dennoch erscheint die Aufgabe, diese konkreten Verstehensvorgänge der Histo- 
riker:innen zu einem wesentlichen Teil zu algorithmisieren, grundsätzlich lös- 
bar. Die Entwicklung einer entsprechenden Ontologie und die darauf aufbauen- 
de Erschließung von digitalen Quellenkorpora in einer mehr und mehr umfas- 
senden Wissensbasis, würden historisches Wissen in einer völlig neuen Form 
verfügbar machen. Am Ende winkt schließlich jene Verheißung, die Johannes 
Haller schon vor über hundert Jahre mit Blick auf die Akten des Vatikanischen 
Archivs aussprach: „So bietet, bei aller Unscheinbarkeit im einzelnen, dieses 
Material, im großen genommen, ein Hilfsmittel zur Belebung des geschichtli- 
chen Bildes dar, wie es reicher und zuverlässiger nicht leicht gedacht werden 
kann.“ 
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„Ich glaube, Fakt ist...“: 


Der geschichtswissenschaftliche Zugang zum digitalen Edieren 


Abstract: Editions of primary sources are of major interest to historical research. 
They serve as a means to falsify statements about “historical facts”. Digital edi- 
tions attempt to capture the “facts” in formalised form. Therefore, content-ori- 
ented digital editing for historians does not always require to reproduce the text 
in its entirety, but rather to capture and formally describe the semantic struc- 
tures of a source and its content. In this chapter, the content-oriented approach 
to digital editing will be discussed using concrete examples. In these editions, 
the attempt is made to represent subject-specific questions about the historical 
texts in formalised form as data. Such databases, in which the historical data 
and its source are made available together with a so-called “knowledge do- 
main” — conceived as an ontology — defines the framework of formal processing 
of the edition’s data. 


Keywords: digital edition, assertive edition, historical facts, historical informa- 
tion, semantic web, ontology 


Zusammenfassung: Quelleneditionen sind von zentralem Interesse fiir die his- 
torische Forschung. Essenziell fiir geschichtswissenschaftliche Editionen ist es, 
Aussagen von Historiker:innen über „historische Fakte“ falsifizierbar zu ma- 
chen. In ihrer digitalen Version geht es darum, sie in formalisierter Form zu er- 
fassen. Zu diesem Zweck ist es fiir eine inhaltsorientierte digitale Edition von 
Quellen nicht immer nötig, den Text in seiner Gesamtheit wiederzugeben, son- 
dern die semantischen Strukturen einer Quelle zu erfassen und formal zu be- 
schreiben. Anhand konkreter Beispiele aus dem Umfeld der digitalen Edition 
wird der inhaltsorientierte Zugang zum Edieren erörtert. In diesen Editionen 
wird versucht, fachspezifische Fragestellungen an die historischen Texte in for- 
malisierter Form als Daten abzubilden. Solche quellenbasierten Datenbanken, 
in denen die historischen Daten und ihre Quelle zur Verfügung gestellt werden, 
zusammen mit einer sogenannte „knowledge domain“ - als Ontologie gedacht - 
definieren den Rahmen der formalen Verarbeitung der Editionsdaten. 


Schlagwörter: Digitale Edition, Assertive Edition, historische Fakten, histori- 
sche Information, Semantic Web, Ontologie 
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Historiker:innen argumentieren mit Fakten, die in Quellen belegt sind. Sind 
Quelleneditionen fiir Historiker:innen also „Faktengeneratoren“? Wir möchten 
im Folgenden die epistemische Funktion digitaler Editionen fiir die Geschichts- 
wissenschaft reflektieren. Wir behaupten, dass digitale Editionen zwei methodi- 
sche Grundlagen besonders gut abbilden: den Perspektivismus und die Intersub- 
jektivität historischer Erkenntnis. Der Beitrag versucht deshalb zunächst, die ge- 
schichtswissenschaftliche Vorstellung von Fakten zu beschreiben, um das 
Verhältnis zwischen Quellen und Fakten zu bestimmen. Daraus können Aufga- 
ben geschichtswissenschaftlicher Edition allgemein abgeleitet werden. Wie di- 
gitale Editionen diese Aufgaben erfüllen, wird schließlich theoretisch und an 
Beispielen diskutiert. 


1 Fakten, Quellen und historische Interpretation 


Die Phrase „Fakt ist...“ ist geläufig und ein gern verwendetes rhetorisches Mit- 
tel. Häufig ist diese Phrase bei Politiker:innen zu finden, die sie noch mit dem 
Zusatz „evidenzbasiert“ aufzuwerten versuchen, oder die eben mal „die Fakten 
auf den Tisch legen“. Die politische Rhetorik bedient sich dabei des umgangs- 
sprachlichen Verständnisses von „Fakt“ als einem „wirklichen, nachweisbaren, 
bestehenden, wahren oder anerkannten Sachverhalt.“ So zumindest definiert 
die Wikipedia „Tatsachen“, die sie als Synonym für „Fakten“ setzt.’ Historische 
Fakten sind besonders konfiguriert. In der Geschichtswissenschaft sind histori- 
sche Fakten Grundlage für Aussagen über vergangene Wirklichkeit, mit denen 
die Historiker:innen ihre historischen Deutungen begründen.“ Da die menschli- 
chen Handlungen der Vergangenheit nicht mehr existieren, sind sie im Sinne 


1 Dieser Text ist unter maßgeblichen Beiträgen von Hans Clausen entstanden. Wir möchten 
uns besonders bei Patrick Sahle, unserem Respondenten auf der Digital History Konferenz, 
sowie Gabriele Haug-Moritz und Gunter Vasold für ihr konstruktives Feedback zu einer frühen 
Fassung des Aufsatzes bedanken. Die Arbeiten an den vorgestellten Projekten werden von der 
Mellon-Foundation (Projekt 1907-06980) und dem FWF (Projekt I 3446) gefördert. 

2 Wikipedia, „Tatsache“, Zugriff am 20.07.2021, https://de.wikipedia.org/wiki/Tatsache. Wir 
werden im Folgenden ebenso „Fakten“ und „Tatsachen“ gleichsetzen. 

3 Eine Übersicht über die philosophischen Diskussionen über „Fakten“ geben Kevin Mulligan 
und Fabrice Correia, „Facts“, in The Stanford Encyclopedia of Philosophy (Standford, Winter 
Edition, 2020), hg. v. Edward N. Zalta, Zugriff am 20.07.2021, https://plato.stanford.edu/archi 
ves/win2020/entries/facts/. 

4 Richard J. Evans, Fakten und Fiktionen (Frankfurt/New York: Campus Verlag, 1998), 78-103. 
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von Searle’ „beobachterabhängig“. Sie existieren nur in der Perspektive der His- 
toriker:innen auf die vergangene Wirklichkeit (Perspektivismus).° Historische 
Fakten sind abhängig von den Theorien, von denen sich die Historiker:innen 
bei der Interpretation von Quellen leiten lassen. „Die Entscheidung darüber, 
welche Faktoren zählen sollen, oder nicht, fällt zunächst auf der Ebene der 
Theorie, welche die Bedingungen möglicher Geschichte setzt.“ 

Dass Geschichte vor dem Hintergrund variabler theoretischer Vorannahmen 
und Metaerzählungen entsteht, bedeutet jedoch nicht, dass es sich bei ihr um 
ein Sammelsurium individueller Interpretationen handelt. Im klassischen Ver- 
ständnis ist Geschichte kollektiv geteilte Auffassung über die Vergangenheit 
(Intersubjektivität). Die Möglichkeit der Übereinkunft über den Status von histo- 
rischen Fakten ist an geteilte Forschungsmethoden gebunden, unter denen die 
„historische Methode“ besonders prominent ist. Dazu gehört die kritische Inter- 
pretation von Quellen für eine Darstellung der vielen möglichen Vorstellungen 
von der Vergangenheit, unter Offenlegung der Darstellungsabsichten.® Die Aus- 
wertung von Quellen ist der Weg, gemeinsame Erkenntnisse über die Vergan- 
genheit zu gewinnen.’ In Jörn Rüsens Definition von historischer Forschung 
wird das Wissen „über die menschliche Vergangenheit aus den empirischen Ge- 
gebenheiten vergangenen menschlichen Lebens“ ermittelt. Auch in modernen 
medientheoretisch fundierten Geschichtstheorien, wie sie zum Beispiel Tschig- 
gerl, Walach und Zahlmann verteten, sind die Quellen Kern des überindividuel- 
len Diskurses in der Geschichtswissenschaft, der ihnen ihre historische Bedeu- 
tung einschreibt." 


5 John R. Searle, „Social ontology: Some basic principles,“ Anthropological theory 6/1 (2006): 
12-29, doi: 10.1177/1463499606061731. 

6 Zum Perspektivismus der Geschichtswissenschaft vgl. Jörn Rüsen, Grundzüge einer Historik, 
Bd. II, (Göttingen: Vandenhoeck & Ruprecht, 1986). 

7 Reinhart Koselleck, „Standortbindung und Zeitlichkeit: Ein Beitrag zur historiographischen 
Erschließung der geschichtlichen Welt,“ in Objektivität und Parteilichkeit in der Geschichtswis- 
senschaft, hg. v. Reinhart Koselleck et al. (München: dtv, 1977), 45. 

8 Johann Gustav Droysen, Historik: Vorlesungen über Enzyklopädie und Methodologie der Ge- 
schichte (1882), hg. v. Rudolf Hübner (München: R. Oldenbourg Verlag, 1977); Ernst Bernheim, 
Lehrbuch der historischen Methode und der Geschichtsphilosophie: mit Nachweis der wichtigsten 
Quellen und Hilfsmittel zum Studium der Geschichte (Leipzig: Duncker & Humblot, 1908); Evans, 
Fakten und Fiktionen, 78-103. 

9 Bernheim, Lehrbuch der historischen Methode, 185; Jörn Rüsen, Geschichte denken: Erläute- 
rungen zur Historik (Wiesbaden: Springer VS, 2020), 8. 

10 Rüsen, Geschichte denken, 7. 

11 Martin Tschiggerl, Thomas Walach und Stefan Zahlmann, Geschichtstheorie (Wiesbaden: 
Springer Fachmedien Wiesbaden, 2019), doi: 10.1007/978-3-658-22882-8, 92-93. 
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Dabei sind die Quellen auch Teil des grundsätzlichen Perspektivismus von 
Geschichtswissenschaft. An sich können alle Relikte früheren menschlichen 
Handelns” von Historiker:innen als solche empirischen Gegebenheiten verwen- 
det werden und so zum Ankerpunkt der Erkenntnis von der Vergangenheit wer- 
den. Mit Gustav Droysens methodischer Trias von Heuristik, Kritik und Interpre- 
tation der Quellen wird aber deutlich, dass nicht jedes Relikt von sich aus Quel- 
le ist. Erst im Zuge der Heuristik werden beliebige Relikte zu Quellen, indem sie 
von Forschenden fiir die eigene Fragestellung fiir relevant gehalten werden. So 
unterliegt schon die Quellenauswahl dem Perspektivismus der Geschichtswis- 
senschaft. Die Quellen sind nicht Ursprung der einen historischen Wirklich- 
keit, vielmehr sind sie der Ausgangspunkt eines Diskurses, der durch den Hin- 
tergrund theoretischer Vorentscheidungen und impliziter Annahmen der sie in- 
terpretierenden Historiker:innen geprägt ist.“ 

Auch der Prozess der hermeneutischen Quelleninterpretation ist davon be- 
stimmt, dass die Quellen nicht einfach historische Fakten liefern, sondern sie 
Teil des geschichtswissenschaftlichen Diskurses sind, in dem ein:e Historiker:in 
die eigenen Auffassungen von der Vergangenheit intersubjektiv etablieren will. 
Die Quelle ist nicht ein absolut giiltiger Beweis, sondern sie macht die eigene 
Sichtweise plausibel oder widerlegt bestehende historische Fakten. Epistemolo- 
gisch kommt den Quellen primar ein ,,Vetorecht“ zu: die Quellen ,,verbieten 
uns, Deutungen zu wagen oder zuzulassen, die aufgrund eines Quellenbefun- 
des schlichtweg als falsch oder als nicht zulässig durchschaut werden kön- 
nen“. In ihrer Funktion, bestimmte Aussagen über die Geschichte zu stützen 
oder zu falsifizieren, „überträgt [die Rede vom Vetorecht der Quellen] gewisser- 
maßen das Falsifizierungsprinzip von Karl R. Popper (1902-1994) in den Be- 
reich historischer Erkenntnistheorie.“'® 


12 Wir folgen hier Hüttenbergers Überlegungen, dass der Unterschied zwischen „Tradition“ 
und „Überrest“ erst ein sekundärer ist, weil beide quellenkritisch zunächst einmal ein Überrest 
der Handlungen der Autor:innen sind und beide von Handlungen der Menschen in der Ver- 
gangenheit berichten. Peter Hüttenberger, „Überlegungen zur Theorie der Quelle,“ in Einfüh- 
rung in die Interpretation historischer Quellen. Schwerpunkt: Neuzeit, hg. v. Bernd A. Rusinek et 
al. (Paderborn/München/Wien/Zürich: Ferdinand Schöningh, 1992), 253-265. 

13 Gabriele Haug-Moritz hat uns vorgeschlagen, diese Funktion der Quellenedition als 
„Schaufenster“ des spezifischen Forschungsinteresses zu bezeichnen, was schön in das Bild 
des Perspektivismus passt. 

14 Koselleck, „Standortbindung und Zeitlichkeit,“ 45. 

15 Koselleck, „Standortbindung und Zeitlichkeit,“ 45-46. 

16 Stefan Jordan, „Vetorecht der Quellen,“ Docupedia-Zeitgeschichte, (2011): 1-7, doi: 
10.14765/ZZF.DOK.2.570.V1. 
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2 Edieren für historische Fakten 


Historiker:innen ermitteln also mit einer intersubjektiv akzeptierten Methode 
aus Quellen historische Fakten in ihrer jeweiligen Forschungsperspektive. His- 
torische Forschung profitiert davon, wenn Quellen für historische Aussagen in- 
tersubjektiv leichter nachvollziehbar sind. In der vordigitalen Zeit waren die 6f- 
fentliche Zugänglichkeit von Archiven und die Verbreitung der Quellentexte 
durch Druckeditionen dafür die wichtigsten Mittel. In den letzten Jahrzehnten 
haben sich ihnen digitale fotografische Reproduktionen der Quellen hinzuge- 
sellt, die ebenso die Nachvollziehbarkeit von Argumentationen erleichtern. Wis- 
senschaftliches Edieren geht aber über die reine Reproduktion hinaus.” Histori- 
ker:innen müssen die Quelle in der Edition nämlich einer Kritik unterziehen, 
die mehr ist als die korrekte Reproduktion des Textes: Sie müssen überprüfen, 
ob die edierte Quelle sich als Argument für historische Fakten eignet, so wie 
das zum Beispiel in der Echtheitskritik von Urkundeneditionen der Fall ist. 

Eine Edition macht die Quellen auch als Argument nutzbar, indem sie sie in 
den historischen Diskurs einbindet. Auch damit trägt die Edition zur Glaubwür- 
digkeit, der aus den Texten extrahierten Fakten bei. Umstrittene oder ohne Kon- 
text missverständliche Aussagen in Quellen werden kommentiert - und die kri- 
tische Edition von Hitlers Mein Kampf durch das Institut für Zeitgeschichte zeigt 
gut,!® wie weit das gehen kann. Editionen von mittelalterlichen Chroniken wei- 
sen beispielsweise nach, ob Textpassagen nur eine Kopie von anderen Texten 
sind, oder, ob es keine Vorlage dazu gibt. So bekommen die in den kopierten 
und den nicht kopierten Passagen formulierten Aussagen unterschiedliche epis- 
temische Qualitäten: von Selbsterlebtem bis zu Selbsterfundenem, von unre- 
flektierter Aufnahme vorhandenen Wissens bis zum Hinweis auf eine Geistes- 
haltung, weil der Text Teil einer identifizierbaren intellektuellen Tradition ist. 

Die Anschlussfähigkeit von Editionen an den geschichtswissenschaftlichen 
Diskurs führt so zu einer eigenen geschichtswissenschaftlichen Art und Weise 
des Edierens: Nicht nur der Text, auch die in der Quelle ermittelbaren histori- 
schen Fakten sollen der geschichtswissenschaftlichen Argumentation leicht zu- 
sänglich sein. Die Historiker:innen interessieren sich für einen Zugang zu Text, 


17 Manfred Thaller, „Reproduktion, Erschließung, Edition, Interpretation. Ihre Beziehungen 
in einer digitalen Welt,“ in Vom Nutzen des Edierens. Akten des internationalen Kongresses zum 
150-jährigen Bestehen des Instituts für Österreichische Geschichtsforschung, Wien, 3.-5. Juni 
2004, hg. v. Brigitte Merta et al. (Wien et al., 2005), 205-227. 

18 Adolf Hitler, Hitler, Mein Kampf: eine kritische Edition, hg. v. Christian Hartmann et al. 
(München: Institut für Zeitgeschichte, 2016). 
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die Patrick Sahle in seinem „Textrad“ mit „Text als Inhalt“ bezeichnet.'? Die oben 
angeführten Kommentare gehören ebenso dazu, wie die Identifikation von Hand- 
lungen, Ereignissen und den damit verbundenen Daten über Personen, Orte, Da- 
tumsangaben und ähnlichem. Je nach Forschungsschwerpunkt und Quellentyp 
kann das Verständnis darüber variieren, was zentrale Inhalte eines Textes sind. 
Ziel von Editionen, die den Inhalt in den Mittelpunkt rücken, ist es die his- 
torischen Dokumente so aufzubereiten, dass Historiker:innen zielgerichtet zu 
den aus ihrer Perspektive ermittelbaren Fakten kommen. Hierfür haben sich in 
der Druckkultur Verfahren wie etwa Regesten etabliert.’ Die historische Quelle 
wird dabei nicht vollständig wiedergegeben, sondern es reicht, dass die zentra- 
len Aussagen paraphrasiert werden, und sei es nur im sogenannten Kopfregest 
oder Betreff als Kurzinformation über die Inhalte. Ebenso wie in einem Regest 
sind auch in Registern nur die zentralen Entitäten?! erschlossen.” Bedeutende 
historische Editionsreihen im deutschsprachigen Raum wie zum Beispiel die 
Monumenta Germaniae Historica, die „Deutschen Reichstagsakten“, oder die 
Akten der Reichskanzlei des 20. Jahrhunderts demonstrieren diesen Ansatz, in- 
dem sie solche inhaltlichen Zusammenfassungen in die Edition integrieren. In 
der Edition der „Deutschen Reichstagsakten“ geht das Verfahren so weit, dass 
Textpassagen ausschließlich regestiert und manche Quellengruppen nur durch 
Zusammenfassungen („Aktenreferate“) erschlossen werden.” Aus philologi- 


19 Patrick Sahle, Digitale Editionsformen: zum Umgang mit der Überlieferung unter den Bedin- 
gungen des Medienwandels, Teil 3: Textbegriffe und Recodierung (Norderstedt: Books on De- 
mand, 2013), 37-41. 

20 Vgl. zum Beispiel Arbeitskreis für Editionsgrundsätze 1965 oder die Regelwerke von Archi- 
ven: Joachim Kemper, „Neue Richtlinien der staatlichen Archive Bayerns für die Erstellung von 
Urkundenregesten,“ Archivalische Zeitschrift 91 (2009): 209-219, doi: 10.7788/az.2009.91.1.209; 
oder Überlegungen aus dem Umfeld der Regesta Imperii: Regesta Imperii, „Richtlinien für die 
Registrierung von Urkunden (1978),“ in Die Regesta Imperii im Fortschreiten und Fortschritt, 
hg. v. Harald Zimmermann (Köln: Vandenhoeck & Ruprecht, 2000), 87-94; Johannes Mötsch, 
„Vorteile und Grenzen der Regestentechnik,“ in Zimmermann (Hrsg.), Fortschreiten und Fort- 
schritt, 115-127. 

21 Unter Entitäten verstehen wir Ereignisse, Themen, Personen, Orte und andere Daten, die 
sich als Instanz aus einer Klasse ableiten lassen. 

22 Zu den Eigenschaften von Registern über die Funktion als Pfad zu Textstellen hinaus vgl. 
Reinhard Härtel, „Mehr als ein Anhang. Das computererstellte Register,“ in Historische Edition 
und Computer. Möglichkeiten und Probleme interdisziplinärer Textverarbeitung und Textbearbei- 
tung. Berichte von der Internationalen Tagung „Historische Edition und Computer“ Karl-Fran- 
zens-Universität Graz, 26.-30. Oktober 1988, hg. v. Anton Schwob et al. (Graz: Leykam 1989), 
67-84; Horst Kunze, Über das Registermache (München/London/New York/Paris: K G Saur, 
1992). 

23 Gabriele Haug-Moritz et al., „Der Regensburger Reichstag des Jahres 1576 - ein Pilotprojekt 
zum digitalen Edieren frühneuzeitlicher Quellen“ (gekürzter DFG-Antrag), 2018, Zugriff am 
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scher Sicht ist ein solches Verfahren problematisch, da eine fragmentarische 
Wiedergabe eines historischen Textes einen gravierenden Eingriff in einen his- 
torischen Text selbst bedeutet und dieser nicht in seiner Gesamtheit wiederge- 
geben wird. Gleichzeitig erscheint in einer die inhaltliche Dimension bevorzu- 
genden Perspektive eine detaillierte Erfassung der Textgestalt und der Textüber- 
lieferung für „inhaltsarme“ Textstellen nicht notwendig, und wird dann, auch 
im Blick auf die zur Verfügung stehenden Ressourcen, reduziert. 

In der Gutenberg-Galaxis hat es die Edition aber schwer, den Perspektivis- 
mus der Quelleninterpretation abzubilden. Die Unveränderbarkeit der gedruck- 
ten Edition macht es unmöglich, nachträglich andere Perspektiven einzuschlie- 
ßen. Editionstexte sind nur über den umständlichen Weg einer Neuedition mit 
Überarbeitung in einer neuen Perspektive erschließbar, während digitale Editio- 
nen offen für Veränderungen sind. Gedruckte Editionen arbeiten platzsparend, 
was mögliche Perspektiven auf den Text bewusst ausschließt — Regestierung 
und ähnliche Verfahren wurden bereits angesprochen - da der Umfang der Pu- 
blikation einerseits eine Kostenfrage ist, andererseits verteilte Information (Re- 
gister am Ende des Bandes, alternative Darstellungsformen in eigenen Bänden) 
das Arbeiten mit den edierten Quellen erschwert. Ein Register ist eine stark re- 
duzierte Präsentation der Wissensumgebung, die sich auf das Alphabet oder 
eine andere vorgegebene Ordnung (zum Beispiel Begriffshierarchie) und Ver- 
weise als Suchmechanismen reduziert. Im Digitalen können in Suchmasken 
oder facettierten Suchen mehrere Erschließungskriterien gleichzeitig angewen- 
det werden, wodurch die Historiker:innen mehrere für ihr jeweiliges For- 
schungsinteresse nützliche Eigenschaften in die Auswahl von Quellenstellen 
einbeziehen können. Trefferlisten solcher Suchen, Visualisierungen oder Text- 
Bild Synopsen der Editionstexte ordnen die einzelnen Quellenstellen anders als 
in der fixierten Abfolge der Buchseiten und können so neue Interpretationskon- 
texte für die Historiker:innen erzeugen. 


3 Änderung im Digitalen 


Mit der Digitalisierung prägen Algorithmen und Informationssysteme immer 
mehr, „wie Historikerinnen Geschichte denken und folglich auch, wie sie histo- 


16.07.2021, https://static.uni-graz.at/fileadmin/projekte/reichstagsakten-1576/Projektbeschrei 
bung/DFG-Antrag_gekuerzt_dt.pdf. 
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rischen Sinn produzieren.“ Die digitale Edition ist eine Ausprägung dieser Ent- 
wicklung. Digitale Methoden erlauben es, Texte mehrdimensional wiederzuge- 
ben, also historische Inhalte der Texte zugänglich zu machen und dabei gleich- 
zeitig Anspriichen philologischer Disziplinen an kritisch edierte Texte gerecht 
zu werden.” 

Georg Vogeler hat für einen Typ von digitaler Edition,”° der den Anforderun- 
gen der Historiker:innen entspricht, den englischen Namen assertive edition vor- 
geschlagen, den man vielleicht mit Aussagenedition übersetzen könnte. Wir wer- 
den im Folgenden bei einer Eindeutschung als assertive Edition bleiben. Eine 
Assertion ist dabei eine Tatsachenbehauptung auf Grundlage von Inhalten histo- 
rischer Quellen, die in einem digitalen Informationssystem abgebildet ist, das 
aus also Behauptungsdatenbanken besteht. Damit sind nicht die Expertensyste- 
me der 1980er gemeint, die aus einer closed world Schlüsse ziehen sollten, son- 
dern die Behauptungsdatenbanken dokumentieren nur, was die Editor:innen 
als historische Fakten in der von ihnen gewählten Perspektive auf die Quelle für 
ermittelbar halten. Charakteristisch für die assertive Edition ist, dass formale 
Aussagen über historische Sachverhalte in eine Edition eingebettet und mit den 
Repräsentationen der Quelle und editorischen Kommentaren verknüpft sind, so 
dass im Sinne der Quellenkritik der Interpretationsprozess der Editor:innen 
transparent wird. Die Idee der assertiven Edition ist also, dass der historische 
Gehalt einer Quelle in einer Menge von Assertionen steckt, die jeweils mit be- 
stimmten Elementen des Textes korrespondieren oder auf diesen basieren. 

„Historische Fakten“ in formalisierter Form, also die Assertionen, sind 
nämlich auch nur Ergebnisse einer Perspektive auf die Quelle. Diese Perspekti- 
vität kann sich in der digitalen Repräsentation einer bestimmten Wissensdomä- 
ne (Knowledge Domain) abbilden. Die digitale Repräsentation der Wissensdomä- 
ne bildet das Knowledge Environment oder die Wissensumgebung einer Edition.” 
In dieser Umgebung wird das zur formalen Repräsentation und darauf aufbau- 
enden Verarbeitung historischer Quellen notwendige Wissen zusammengeführt. 
Dies beinhaltet Wissen über in Quellen angewandte Orthographie, Fachbegriffe, 
Währungen, soziale Verhältnisse oder viele andere von der Wissensdomäne ab- 


24 Mareike König, „Geschichte digital Zehn Herausforderungen,“ in Geschichtswissenschaft im 
21. Jahrhundert (Berlin/Boston: De Gruyter Oldenbourg, 2020), 68, doi: 10.1515/9783110689143- 
008. 

25 Sahle, Digitale Editionsformen, 37-41. 

26 Georg Vogeler, „The ‚Assertive Edition‘,“ International Journal of Digital Humanities 1/2 
(2019): 309-322, doi: 10.1007/s42803-019-00025-5. 

27 Manfred Thaller, „Historical Information Science: Is there such a Thing? New Comments on 
an old Idea [1993],“ Historical Social Research/Historische Sozialforschung, Supplement 29 
(2017): 260-286, doi: 10.12759/hsr.suppl.29.2017.260-286. 
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hängige Aspekte. Unschärfen, Unsicherheiten oder Kontextabhängigkeiten wie 
zum Beispiel Währung im Verhältnis zu Zeit und Raum, oder zeitgenössische 
Terminologien, die historischen Quellen immanent sind, werden nur innerhalb 
einer gewählten Forschungsperspektive normalisiert. Die Wissensumgebung 
definiert den terminologischen Rahmen und den Geltungsbereich der formali- 
sierten Quellenaussagen. Jede weiterführende Verarbeitung, wie zum Beispiel 
Aggregation von Datenpunkten für eine Visualisierung, ist ausschließlich in 
dieser Wissensumgebung zu verstehen. Sie fasst kontrollierte Vokabularien, 
strukturierte Daten und formale Modelle zusammen. 

Die Wissensumgebung reicht über eine einzelne Quellenedition hinaus: 
Zum Beispiel lässt sich der Fluss von ökonomischen Gütern und Geldbeträgen, 
also von Transaktionen, nicht nur in Rechnungsbüchern finden, die für sich 
schon in tabellarischen oder listenähnlichen Formaten existieren. Auch in an- 
deren historischen Quellen sind Transaktionen dokumentiert und können für 
Forschungsvorhaben relevant sein: Friedrich Schleiermacher hat beispielsweise 
in seinen Tageskalendern nicht nur tagebuchartige Notizen vermerkt, sondern 
auch Einkäufe und Verkäufe dokumentiert.” Ein Modell, das versucht, Transak- 
tionen auf abstrakter Ebene zu beschreiben, kann auf unterschiedliche Quellen 
und sogar Quellengattungen angewendet werden. Gleichzeitig kann eine Quelle 
in unterschiedliche Wissensumgebungen integriert werden, kann schleierma- 
cher digital also auch für prosopographische Forschung Personen im Tageska- 
lender identifizieren oder für ideengeschichtliche Fragestellungen die Werke er- 
mitteln, die er rezipiert. Die assertive Edition ermöglicht, historische Quellen 
aus unterschiedlichen Perspektiven zu bearbeiten, und diese zugleich als Wis- 
sensumgebung formalisiert mitzuliefern. 

Die formalisierte Wissensdomäne in der assertiven Edition erlaubt auch die 
Verknüpfung der Quelle mit Datensätzen bestehender Ressourcen, wie etwa 
Normdateien. Die Wissensumgebung trägt damit zur Intersubjektivität der er- 
mittelten Fakten bei, indem diese Verknüpfung die Systematizität des von der 
Edition repräsentierten Wissens erhöht. 

Aus der Funktion der digitalen Edition in der Geschichtswissenschaft, nicht 
nur einen Text, sondern auch eine Behauptungsdatenbank darzustellen, folgen 
weitere Anforderungen: 

- Die digitalen Mittel, die bei der Erarbeitung der Edition eingesetzt werden, 
müssen kritisch reflektiert werden. Die Diskussion über die Zuverlässigkeit 


28 Wolfgang Virmond (unter Mitarbeit von Holden Kelm), „Schleiermachers Tageskalender 
1808-1834,“ in schleiermacher digital, hg. v. Elisabeth Blumrich et al. (Berlin: Berlin-Branden- 
burgische Akademie der Wissenschaften, seit 2012). Zugriff am 23.07.2021, https://schleierma 
cher-digital.de/tageskalender/index.xql. 
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automatischer Transkription von handgeschriebenen Texten ist ein Beispiel 
dafiir. Unter dem Begriff Digitale Hermeneutik wird tiber die kritische Refle- 
xion der geschichtswissenschaftlichen Methode unter diesen Bedingungen 
und über den Wandel der Arbeitsweisen von Historiker:innen von der Quel- 
le zum Dokument zu Daten diskutiert. Formale Methoden in der Verarbei- 
tung von historischer Information suggerieren eine Objektivität, die es zu 
dekonstruieren gilt.” Die Aufarbeitung und die Interpretation historischer 
Quellen mit digitalen Methoden bedarf auch einer Kritik an Daten und 
Werkzeugen.* Die von der assertiven Edition gebildeten Datenbanken müs- 
sen die Herkunft der in ihnen gespeicherten Fakten offenlegen. 

- Eine digitale Edition erzeugt Informationen, die als Daten in weiterer histo- 
rischer Forschung mit algorithmischen Mitteln verarbeitet werden sollen. 
Das gilt auch für die von Editor:innen ermittelten Tatsachendarstellungen 
der Quellen. Textuelle Beschreibungen reichen deshalb nicht aus. Mit den 
Ergebnissen assertiver Editionen soll man Statistiken erstellen können, Fil- 
ter darauf anwenden, sie mit anderen Datensätzen als Linked Data ver- 
knüpfen oder, wenn die Wissensdomäne in Sprachen zur Abbildung forma- 
ler Logik wie OWL?! oder SWI-Prolog” ausgedrückt werden, formale Schlüs- 
se ziehen. 


4 Wie erzeugt man Editionen als Behauptungs- 
datenbanken? 


Die technische Umsetzung von assertiven Editionen erfolgt gemeinhin über die 
Auszeichnung textlicher Repräsentanten semantischer Strukturen. Der Web-of- 
Data-Stack kann für diese Zwecke herangezogen werden. Dabei lassen sich die 


29 Joris J. van Zundert, „Screwmeneutics and Hermenumericals: The Computationality of Her- 
meneutics,“ in A New Companion to Digital Humanities, hg. v. Susan Schreibman et al. (Hobo- 
ken, New Jersey: John Wiley & Sons, 2015), doi: 10.1002/9781118680605.ch23. 

30 Andreas Fickers, „Update für die Hermeneutik. Geschichtswissenschaft auf dem Weg zur 
digitalen Forensik?“ Zeithistorische Forschungen 17/1 (2020): 157-168, 10.14765/zzf.dok-1765 so- 
wie den Beitrag in diesem Band. 

31 OWL Web Ontology Language, https://www.w3.org/TR/owl-features. 

32 Ein Beispiel für diesen Ansatz: Jana Kittelmann und Christoph Wernhard, „KBSET - Know- 
ledge-Based Support for Scholarly Editing and Text Processing with Declarative LaTeX Markup 
and a Core Written in SWI-Prolog,“ Lecture Notes in Computer Science, arXiv:2002.10329 [cs] 
12057 (2020): 178-196, doi: 10.1007/978-3-030-46714-2_12. SWI-Prolog, https://www.swi-pro 
log.org. 
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einzelnen Assertions in RDF” und notwendige Modelle als Ontologien beschrei- 
ben. Für die digitale Edition können semantische Strukturen in XML/TEI* über 
das ana-Attribut® auf Ontologien referenziert werden. Daraus lassen sich Trip- 
le-Aussagen ableiten, die Tatsachenbehauptung im Sinne einer Ontologie dar- 
stellen. Ein Personenname in einer Quelle kann dadurch zu einer Akteurin in 
einer Transaktion (Rechnungsbücher) oder zu einem Kommunikationspartner 
(Besprechungsprotokolle, Briefe) werden. 

Die Normalisierung und Identifikation von Entitäten wird im Web-of-Data- 
Stack über unique identifiers (URI) realisiert. Dadurch werden internetweit ein- 
deutige Namen für Konzepte erzeugt, auf die dann aus den Editionen heraus 
verwiesen werden kann. URIs ermöglichen die Repräsentation von Entitäten 
ohne die möglichen Mehrdeutigkeiten natürlicher Sprache, wie etwa orthogra- 
phische Variationen. Diese Methode kann zum Beispiel für die Erweiterung von 
Registern verwendet werden, um Personen und Orte über URIs zu identifizieren 
und damit mit externen Ressourcen zu vernetzen. 

Für menschliche Nutzer:innen werden die Assertions im User Interface der 
Edition in der Form von erweiterten Registern, Kalendern und Timelines und 
Karten nutzbar gemacht, in Editionen von Wirtschaftsdokumenten vor allem als 
Diagramme, aber auch als Netzwerkvisualisierungen, um zum Beispiel Korres- 
pondenznetzwerke zu veranschaulichen.”* Der Web-of-Data-Stack und RESTful 
APIs verbessern die Nachnutzung der Daten durch Maschinen. Die Einbindung 
und Vernetzung der Daten mit bereits existierenden Ressourcen wie etwa Norm- 
daten und die Anbindung an existierende Top-Level Ontologien wie zum Bei- 
spiel das CIDOC CRM” machen die assertive Edition zu einer Linked Open Data 
Ressource und zu einem Baustein im historischen Knowledge Graph. 


5 Beispiele 


Assertive Editionen müssen nicht unter dieser Bezeichnung erscheinen. So sind 
die Editionen der Notizbücher von Paolo Bufalini’? ebenso assertive Editionen 


33 Resource Description Framework, https://www.w3.org/TR/rdf11-concepts. 

34 Text Encoding Initiative, https://tei-c.org. 

35 https://www.tei-c.org/release/doc/tei-p5-doc/en/html/ref-att.global.analytic.html. 

36 Für Beispieleditionen siehe Vogeler, „The ,Assertive Edition‘,“ 312-313. 

37 CIDOC Conceptual Reference Model, http://www.cidoc-crm.org/. 

38 Francesca Tomasi, „L’informazione digitale e il Web semantico. Il caso delle scholarly digi- 
tal editions,“ in Informatica umanistica: risorse e strumenti per lo studio del lessico dei beni 
culturali, hg. v. Valeria Zotti und Ana Pano Alamän (Florenz: Firenze University Press, 2017), 
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wie Sandrart.net,” die Edition der Werke von Johannes Friedrich Blumenbach‘? 
oder verschiedene Editionsprojekte im Symogih-System.*! An der Universität 
Graz werden verschiedene assertive Editionen realisiert, die illustrieren können, 
wie sich das Verhältnis zwischen Quelle und Fakten mit digitalen Mitteln aus- 
drücken lässt. 


5.1 Rechnungsbücher 


Güter- und Geldflüsse zu dokumentieren ist der Zweck von Rechnungsbüchern. 
Historisches Forschungsinteresse daran liegt nicht nur in den Einzeleinträgen, 
sondern auch in der Aggregation von Daten aus größeren Quellenbeständen. In 
einer assertiven Edition werden die Einträge in Rechnungsbüchern zu formali- 
sierten Aussagen über Transaktionen. Diese Perspektive auf die Rechnungsbü- 
cher wird in einer Domänenontologie beschrieben. 

Die Bookkeeping Ontology“ ist ein Modell zur formalen Beschreibung von 
Transaktionen in historischen Rechnungsunterlagen. Darin wird eine Transak- 
tion als eine Menge von mindestens einem Transfer definiert. Jeder Transfer um- 
fasst den Austausch von wirtschaftlichen Gütern oder Geldbeträgen, die von 
Akteur:in zu anderen fließen. Geldbeträge sind dadurch gekennzeichnet, dass 
sie aus einer Zahl und einer Währung bestehen und es können damit auch Spe- 
zialfälle wie Steuern oder Preise abgebildet werden. Die wirtschaftlichen Güter 


157-74. Marilena Daquino, Francesca Giovannetti und Francesca Tomasi, „Linked Data per le 
edizioni scientifiche digitali. Il workflow di pubblicazione dell’edizione semantica del quader- 
no di appunti di Paolo Bufalini,“ Umanistica Digitale 3/7 (2019): 49-75, doi: 10.6092/issn.2532- 
8816/9091. 

39 Sandrart.net: Eine netzbasierte Forschungsplattform zur Kunst- und Kulturgeschichte des 17. 
Jahrhunderts, hg. v. Anna Schreurs, Carsten Bliim und Thorsten Wiibbena (Wolfenbiittel: Her- 
zog-August-Bibliothek, [2012]), Zugriff am 21.07.2021, http://www.sandrart.net/de. 

40 Jörg Wettlaufer, Christopher Johnson, Martin Scholz, Mark Fichtner und Sree Ganesh Tho- 
tempudi, „Semantic Blumenbach: Exploration of Text-Object Relationships with Semantic Web 
Technology in the History of Science,“ Digital Scholarship in the Humanities 30 (supl_1) (2015): 
i187-i198, doi: 10.1093/llc/fqv047. 

41 The symogih.org project: a modular system for managing historical information. http://sym 
ogih.org/. Francesco Beretta, „Pour une annotation sémantique des textes: le projet symogih. 
org et la Text encoding initiative,“ Bruniana e Campanelliana, Ricerche filosofiche e materiali 
storico — testuali 22/2 (2016): 453-465, doi: 10.19272/201604102005. 

42 Christopher Pollin, „Digital Edition Publishing Cooperative for Historical Accounts and the 
Bookkeeping Ontology,“ in Proceedings of the Doctoral Symposium on Research on Online Data- 
bases in History (RODBH 2019), hg. v. Thomas Riechert et al. 7-14. Leipzig: CEUR-WS 2020. 
Zugriff am 20.07.2021, http://ceur-ws.org/Vol-2532/paper1.pdf. 


„Ich glaube, Fakt ist..“: ——= 183 


wiederum werden aufgeteilt in Waren - bestehend aus Menge, Einheit und 
Art - und Dienstleistungen, die über eine zeitliche Komponente verfügen. Ak- 
teur:innen in Transfers können Individuen, Gruppen oder Organisationen oder 
Kategorien innerhalb von Konten (zum Beispiel Ausgaben für Bautätigkeiten) 
sein. Der Eintrag in der Quelle fungiert als Beleg der Assertion vom Typ „Trans- 
aktion“ und wird als solcher abgebildet. Die verwendeten Kernbegriffe lassen 
sich in das konzeptuelle Referenzmodell des CIDOC CRM integrieren. 

So ergibt sich die Möglichkeit, jede Transaktion in ihrer zeitlichen, räumli- 
chen und inhaltlichen Dimension, also der Zuordnung zu einem bestimmten, 
durch die Forschungsfrage geprägten Zusammenhang zu beschreiben. Die se- 
mantische Struktur „Transaktion“ kann unabhängig von einer spezifischen his- 
torischen Fragestellung beschrieben werden. Aber erst in der konkreten Kontex- 
tualisierung einer Transaktion bekommen Währungen, Maßeinheiten, Perso- 
nen, Preise einen Wert. Die Zuordnung eines Wertes zu diesen Entitäten im 
Kontext einer wissenschaftlichen Edition sind Annahmen in der Form von histo- 
rischen Fakten. 

Auf Basis dieser Annahmen und ihrer Nachvollziehbarkeit durch die Wis- 
sensdomäne können weitere formale Methoden angewandt werden. Dann wer- 
den die RDF-Daten, modelliert nach der Bookkeeping Ontology, die Primärdaten 
(XML/TEI, CSV), das Digitalisat der Quelle und die Verknüpfungen zu anderen 
Linked Open Data-Vokabularien oder Authority-Files zu einer Wissensumge- 
bung für eine historische Interpretation, wie zum Beispiel eine Finanzgeschich- 
te der Stadt Basel im 16. Jahrhundert. 


5.2 Deutsche Reichstagsakten - der Reichstag von 1576 


Die digitale Edition der Akten des Reichstags von 1576 ist geprägt von einer lan- 
gen, im Falle der Abteilung „Reichsversammlungen“ in die ausgehenden 
1980er Jahre zurückreichenden Tradition und einer modernen historischen Fra- 
gestellung. Die digitale Methode vermittelt zwischen beiden und kann so eine 
assertive Edition erzeugen, die über die reine Übersetzung etablierter Erschlie- 
ßungsmethoden (zum Beispiel einen Index) in geschichtswissenschaftlichen 
Editionen hinausgeht. In der neueren Forschung zu vormodernen parlamentari- 
schen Versammlungen begegnet international in den vergangenen Jahren näm- 
lich immer mehr ein Erkenntnisinteresse, das nicht mehr „nur“ an der inhaltli- 
chen Seite dieser Versammlungsereignisse interessiert ist, sondern Ständever- 
sammlungen als Kommunikations- und Interaktionszusammenhänge in den 
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Blick nimmt. Die von der Edition zu dokumentierenden Fakten sind damit 
nicht nur die verhandelten Themen und getroffenen Entscheidungen, nicht nur 
die inhaltlichen Positionen, die von den politischen Akteur:innen geäußert wur- 
den, sondern auch Personen, die miteinander sprechen, die Gespräche proto- 
kollieren oder darüber berichten, oder sich schriftliche Anweisungen und 
Berichte schicken.’ Die digitale Edition erzeugt deshalb eine Datenbank von 
Kommunikationssituationen. In diese fließen nicht edierte, aber detailliert er- 
schlossene Archivalien ebenso ein wie Teile von umfangreichen Protokollen 
oder Berichte, die das Versammlungsgeschehen dokumentieren. 

Realisiert wird die digitale Edition mithilfe von an EAD“ angelehnte Archi- 
valienbeschreibungen, TEI-Transkriptionen und RDF-Extrakten. Dem RDF liegt 
eine im Projekt entwickelte Domänenontologie von Kommunikation in vormo- 
dernen parlamentarischen Versammlungen zugrunde. Sie verwendet Kernbe- 
griffe, die sich auf die Klassen des CIDOC CRM abbilden lassen. Die Grundan- 
nahme ist, dass sich die politische Interaktion auf dem Reichstag in den erfass- 
ten Kommunikationsakten abgespielt hat. Landeshistorische Forschung kann 
also zum Beispiel die Sitzungen filtern, in denen Repräsentanten des jeweiligen 
Territorialfürsten anwesend waren. Die These über die zentrale - und bislang 
editorisch „unterbelichtete“ — Rolle des Kaisers auf dem Reichstag“ kann durch 
Befunde über die Beteiligung des Kaiserhofs an den vielfältigen Beratungen un- 
tersucht werden. Eine solche Fragestellung wird durch die digitale Edition auf 
neue Art und Weise beantwortbar, da die Behauptungsdatenbank der Edition 
auch Kommunikationsakte enthält, die von nicht im Volltext edierten Doku- 
menten belegt sind: Ladungsschreiben (durch den Kaiser) oder Ereignisse aus 
den Hofratsprotokollen (mit den zum Anlass des Reichstags eingereichten Sup- 
pliken). Die Wissensressource integriert sich auch in eine nach RiC modellierte 
Archiverschließung,* auch wenn die Wissensdomäne derzeit den in Entwick- 
lung befindlichen Standard noch nicht berücksichtigt. Dass die Verknüpfung 
der erwähnten Personen mit einschlägigen prosopographischen Ressourcen“ 


43 Michel Hébert, Parlementer. Assemblées représentatives et échange politique en Europe occi- 
dentale a la fin du Moyen Age (Paris: Editions de Boccard, 2014). 

44 Gabriele Haug-Moritz, „Deliberieren. Zur ständisch-parlamentarischen Beratungskultur im 
Lateineuropa des 16. Jahrhunderts,“ Historisches Jahrbuch 141 (2021): 115-155. 

45 Encoded Archival Description, https://www.loc.gov/ead/. 

46 Gabriele Haug-Moritz et al., „Pilotprojekt zum digitalen Edieren frühneuzeitlicher Quellen“. 
47 International Council on Archives - Experts Group on Archival Description: Records in Con- 
texts. A Conceptual Model for Archival Description (Consultation Draft), 2016, bzw. der aktuelle 
Stand der Ontologie in https://www.ica.org/standards/RiC/RiC-O_vO-2.html. 

48 Zum Beispiel Kaiser und Höfe. Personendatenbank der Höflinge der österreichischen Habs- 
burger des 16. und 17. Jahrhunderts, https://kaiserhof.geschichte.Imu.de. 
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neue Fakten zum historischen Knowledge Graph als Linked Open Data beitra- 
gen wird, ist eine Selbstverstandlichkeit. 


6 Fazit 


Im methodischen Diskurs der Geschichtswissenschaft spielen Editionen bislang 
keine besondere Rolle. Sie werden in der Praxis hingenommen, eingefordert, in 
ihrer Qualität gelobt oder kritisiert, aber nicht in Beziehung gesetzt zur Episte- 
mologie der Geschichtswissenschaft. Sie sind gewissermaßen transparent zu 
den Quellen selbst. Medienwandel kann auch hier zu einer neuen Reflexion 
über den methodischen Status der Edition führen: Mit der digitalen Transforma- 
tion wird die historische Aussage der Quellen Teil des elektronisch auswertba- 
ren Datenbestandes, den Historiker:innen als Grundlage ihrer digital gestützten 
Forschung verwenden können. Kritik an der Erschließungstiefe einer Edition 
kann sich damit in Kritik zum Beispiel an der Verwendbarkeit einer digitalen 
Edition für Netzwerkanalysen oder statistische Auswertungen übersetzen. Die 
Geschichtswissenschaft kann in der assertiven Edition eine eigene Editionsform 
entwickeln. 

Die assertive Edition baut auf zwei geschichtstheoretischen Grundlagen 
auf: Historische Fakten entstehen erstens erst durch die Akzeptanz im Diskurs 
der Historiker:innen, sind also intersubjektiv. Historische Fakten sind zweitens 
perspektivenabhängig und theoriegebunden. Quellen sind das empirische 
Werkzeug der Argumentation im Diskurs über historische Fakten. Sie unterlie- 
gen ebenso in Heuristik und Kritik immer der Perspektivität und der Intersub- 
jektivität von Geschichtswissenschaft. Editor:innen als „Anwälte des Veto- 
rechts“ der Quellen müssen deshalb sowohl die Aussagen der Quellen über his- 
torische Fakten zu ermitteln versuchen („Text als Inhalt“) als auch offenlegen, 
dass sie nur eine Perspektive auf die Quelle wiedergeben, die aus einer be- 
stimmten Wissensdomäne gespeist ist. Die assertive digitale Edition erreicht 
das, indem sie erstens neben der Textwiedergabe auch RDF-Aussagen anbietet 
und sie eng an die Quelle bindet. Um die Perspektivität der Aussagen deutlich 
zu machen, bettet sie zweitens die RDF-Aussagen in eine formalisierte Wissens- 
domäne ein, als Linked Open Data, als kontrollierte Vokabularien und als TBox 
im Sinne der semantischen Technologien. 

Die assertive Edition steht natürlich selbst unter einem historischen Vorbe- 
halt: Fragestellungen können sich ändern und mit ihnen der Bedarf neuer Fak- 
ten für die wissenschaftliche Argumentation. Welche Zeremonien auf einem 
Reichstag stattfanden, war vor 30 Jahren im Mainstream der Geschichtswissen- 
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schaft vielleicht noch keine relevante Information. Das Interesse an geschichts- 
wissenschaftlichen Editionen als zuverlässige Lieferanten von Fakten ändert 
sich jedoch nicht. Neue Fragestellungen erfordern dann vielleicht Neueditio- 
nen, die sich mit den editorischen Entscheidungen über die zu dokumentieren- 
den Aussagen einer älteren assertiven Edition auseinandersetzen. Das Semantic 
Web ermöglicht aber auch, einen existierenden Editionstext mit einer neuen 
Ebene an formalisierten Aussagen zu versehen. Wenn eine assertive Edition der 
Reichstagsakten jetzt die historischen Kommunikationssituationen in den Mit- 
telpunkt rückt, ist damit nicht ausgeschlossen, die Aussagen über die politische 
Wirklichkeit in den Berichten und Protokollen oder die von den Akteur:innen 
verwendeten Argumente als RDF-Aussagen zu repräsentieren, und die gewählte 
Perspektive in einer Ontologie der verwendeten Wissensdomäne auszudrücken. 

Das gilt auch für die Methode, mit der die Aussagen aus den Quellen ermit- 
telt werden. Die assertive Edition steht in einem hoffentlich fruchtbaren Aus- 
tausch zu den aktuellen Bemühungen, Informationen automatisch aus digitali- 
sierten Originalquellen zu extrahieren,“ die in der eher visionären Konzeption 
einer vollständigen Transformation historischer Datenspeicherformen und den 
Vorstellungen einer europäischen Zeitmaschine kulminieren,”° aber sehr wohl 
auch praktische Verfahren in kleinen Anwendungsszenarien testen. Die auto- 
matischen Verfahren unterliegen aber den gleichen Überlegungen, wie wir sie 
für die assertive Edition angestellt haben: Wenn die wissenschaftliche Edition 
als Treuhänder der Historiker:innen über die intersubjektive Verwendbarkeit 
der Quellenaussagen als beobachterabhängige und im gemeinsamen Diskurs le- 
gitimierte Fakten wacht, dann gilt das ebenso für die Algorithmen „künstlicher 
Intelligenz“, die mit maschinellem Lernen typische menschliche Interpretati- 
onsvorgänge nachbilden und auf unbekanntes Material übertragen. Die dabei 
erzeugten Daten sind als Interpretationen zu kennzeichnen, die Verfahren ihrer 
Erzeugung zu dokumentieren und zu kontextualisieren, die Beziehung zur Ori- 
ginalquelle ist nachvollziehbar zu machen - alles Verfahren, die aus der Tradi- 
tion kritischen Edierens wohlbekannt sind. 


49 Zum Beispiel Emanuela Boros et al., „A comparison of sequential and combined approa- 
ches for named entity recognition in a corpus of handwritten medieval charters,“ in 17th Inter- 
national Conference on Frontiers in Handwriting Recognition (ICFHR), Sep 2020, Dortmund, Ger- 
many, 2020, 79-84, doi: 10.1109/ICFHR2020.2020.00025; Juri Opitz und Anette Frank, „Deri- 
ving Players & Themes in the Regesta Imperii Using SVMs and Neural Networks,“ in 
Proceedings of the 10th SIGHUM Workshop on Language Technology for Cultural Heritage, Social 
Sciences, and Humanities (LaTeCH). Berlin, Germany, hg. v. Nils Reiter et al., 74-83 (Association 
for Computational Linguistics: Berlin, 2016), doi: 10.18653/v1/W16-2108. 

50 Frederic Kaplan und Isabella di Lenardo, „Big Data of the Past,“ Frontiers in Digital Huma- 
nities 4 (2017): 1-12, doi: 10.3389/fdigh.2017.00012. 


„Ich glaube, Fakt ist...“: — 187 


Bibliographie 


Arbeitskreis für Editionsgrundsätze. „Richtlinien für die Regestierung von Urkunden.“ Blätter 
für Deutsche Landesgeschichte 101 (1965): 1-7. 

Bernheim, Ernst. Lehrbuch der historischen Methode und der Geschichtsphilosophie: mit 
Nachweis der wichtigsten Quellen und Hilfsmittel zum Studium der Geschichte. Leipzig: 
Duncker & Humblot, 1908. 

Beretta, Francesco. „Pour une annotation sémantique des textes: le projet symogih.org et la 
Text encoding initiative.“ Bruniana e Campanelliana, Ricerche filosofiche e materiali sto- 
rico - testuali 22/2. (2016): 453-465, doi: 10.19272/201604102005. 

Boros, Emanuela, Verónica Romero, Martin Maarand, Katerina Zenklova, Jitka Kfeckovä, 
Enrique Vidal, Dominique Stutzmann und Christopher Kermorvant. „A comparison of se- 
quential and combined approaches for named entity recognition in a corpus of handwrit- 
ten medieval charters.“ In 17th International Conference on Frontiers in Handwriting Reco- 
gnition (ICFHR), Sep 2020, Dortmund, Germany. 2020. 79-84. doi: 10.1109/ICF 
HR2020.2020.00025. 

Burger, Daniel, Joachim Kemper und Christian Kruse. Richtlinien der staatlichen Archive Bay- 
erns fiir die Erstellung von Regesten. Miinchen, 2010. Zugriff am 16.07.2021. http://www. 
gda.bayern.de/download/erschliessung/richtlinien_regesten.pdf. 

Clavaud, Florence und International Council on Archives Expert Group on Archival Description 
(ICA EGAD). „International Council on Archives Records in Contexts Ontology (ICA RiC-O) 
version 0.2.“ 2021. Zugriff am 20.07.2021. https://www.ica.org/standards/RiC/RiC-O_v0- 
2.html. 

Daquino, Marilena, Francesca Giovannetti und Francesca Tomasi. „Linked Data per le edizioni 
scientifiche digitali. Il workflow di pubblicazione dell’edizione semantica del quaderno di 
appunti di Paolo Bufalini.“ Umanistica Digitale 3/7 (2019): 49-75. doi: 10.6092/ 
issn.2532-8816/9091. 

Droysen, Johann Gustav. Historik. Vorlesungen über Enzyklopädie und Methodologie der Ge- 
schichte (1882). 8. Aufl., hg. v. Rudolf Hübner, München: R. Oldenbourg Verlag, 1977. 

Encoded Archival Description. Zugriff am 15.10.2021, https://www.loc.gov/ead/. 

Evans, Richard J. Fakten und Fiktionen. Frankfurt/New York: Campus Verlag, 1998. 

Fickers, Andreas. „Update für die Hermeneutik. Geschichtswissenschaft auf dem Weg zur 
digitalen Forensik?“ Zeithistorische Forschungen 17/1 (2020): 157-168. Zugriff am 
13.02.2021. https://zeithistorische-forschungen.de/1-2020/5823. 

Gabriel, Gottfried. „Fakten oder Fiktion? Zum Erkenntniswert der Geschichte.“ Historische Zeit- 
schrift 297/1 (2013): 1-26. doi: 10.1524/hzhz.2013.0305. 

Haug-Moritz, Gabriele et al. „Der Regensburger Reichstag des Jahres 1576 - ein Pilotprojekt 
zum digitalen Edieren frühneuzeitlicher Quellen“ (gekürzter DFG-Antrag). 2018. Zugriff am 
20.07.2021. https://static.uni-graz.at/fileadmin/projekte/reichstagsakten-1576/Projekt 
beschreibung/DFG-Antrag_gekuerzt_dt.pdf. 

Haug-Moritz, Gabriele. „Deliberieren. Zur ständisch-parlamentarischen Beratungskultur im La- 
teineuropa des 16. Jahrhunderts.“ Historisches Jahrbuch 141 (2021): 115-155. 

Härtel, Reinhard. „Mehr als ein Anhang. Das computererstellte Register.“ In Historische Edition 
und Computer. Möglichkeiten und Probleme interdisziplinärer Textverarbeitung und Text- 
bearbeitung. Berichte von der Internationen Tagung „Historische Edition und Computer“ 


188 —— Georg Vogeler, Christopher Pollin, Roman Bleier 


Karl-Franzens-Universität Graz, 26.-30. Oktober 1988. Hg. v. Anton Schwob, Karin Kranich- 
Hofbauer und Diethard Suntinger, 67-84. Graz, 1989. 

Hébert, Michel. Parlementer. Assemblées représentatives et échange politique en Europe occi- 
dentale a la fin du Moyen Age. Paris, 2014. 

Hitler, Adolf. Hitler, Mein Kampf: eine kritische Edition. Hg. v. Christian Hartmann, Thomas Vor- 
dermayer, Othmar Plöckinger und Roman Töppel. München: Institut für Zeitgeschichte, 
2016. 

Hüttenberger, Peter. „Überlegungen zur Theorie der Quelle.“ In Einführung in die Interpretation 
historischer Quellen. Schwerpunkt: Neuzeit (UTB Bd. 1674). Hg. v. Bernd A. Rusinek, Vol- 
ker Ackermann und Jörg Engelbrecht, 253-265. Paderborn/München/Wien/Zürich: Ferdi- 
nand Schöningh, 1992. 

Jordan, Stefan. „Vetorecht der Quellen.“ Docupedia-Zeitgeschichte, (2010): 1-7. doi: 10.14765/ 
ZZF.DOK.2.570.V1. 

Kaplan, Frédéric und Isabella di Lenardo. „Big Data of the Past.“ Frontiers in Digital Humanities 
4 (2017): 1-12. doi: 10.3389/fdigh.2017.00012. 

Kemper, Joachim. ,,Neue Richtlinien der staatlichen Archive Bayerns fiir die Erstellung von Ur- 
kundenregesten.“ Archivalische Zeitschrift 91 (2009): 209-219, doi: 10.7788 / 
az.2009.91.1.209. 

Kittelmann, Jana und Christoph Wernhard. „KBSET — Knowledge-Based Support for Scholarly 
Editing and Text Processing with Declarative LaTeX Markup and a Core Written in SWI- 
Prolog.“ Lecture Notes in Computer Science, arXiv:2002.10329 [cs] 12057 (2020): 178- 
196. doi: 10.1007/978-3-030-46714-2_12. 

König, Mareike. „Geschichte digital Zehn Herausforderungen.“ In Geschichtswissenschaft im 
21. Jahrhundert. 67-76. Berlin/Boston: De Gruyter Oldenbourg, 2020. doi: 10.1515/ 
9783110689143-008. 

Koselleck, Reinhart. „Standortbindung und Zeitlichkeit: Ein Beitrag zur historiographischen 
Erschließung der geschichtlichen Welt.“ In Objektivität und Parteilichkeit in der Ge- 
schichtswissenschaft. Hg. v. Reinhart Koselleck, Wolfgang J. Mommsen und Jörg Rüssen, 
17-46. München: dtv, 1977. 

Kunze, Horst. Über das Registermachen. 4., erw. und verb. Aufl. München/London/New York/ 
Paris: KG Saur, 1992. 

Mötsch, Johannes. „Vorteile und Grenzen der Regestentechnik.“ In Die Regesta Imperii im Fort- 
schreiten und Fortschritt (Forschungen zur Kaiser- und Papstgeschichte des Mittelalters 
20). Hg. v. Harald Zimmermann. 115-127. Köln, 2000. 

Mulligan, Kevin und Fabrice Correia. „Facts.“ In The Stanford Encyclopedia of Philosophy (Win- 
ter 2020 Edition). Hg. v. Edward N. Zalta. Zugriff am 20.07.2021. https://plato.stanford. 
edu/archives/win2020/entries/facts/. 

Opitz, Juri und Anette Frank. „Deriving Players & Themes in the Regesta Imperii Using SVMs 
and Neural Networks.“ In Proceedings of the 10th SIGHUM Workshop on Language Tech- 
nology for Cultural Heritage, Social Sciences, and Humanities (LaTeCH). Berlin, Germany. 
Hg. v. Nils Reiter, Beatrice Alex and Kalliopi A. Zervanou. 74-83. Berlin: Association for 
Computational Linguistics, 2016. doi: 10.18653/v1/W16-2108. 

Pollin, Christopher. ,,Digital Edition Publishing Cooperative for Historical Accounts and the 
Bookkeeping Ontology.“ In Proceedings of the Doctoral Symposium on Research on On- 
line Databases in History (RODBH 2019). Hg. v. Thomas Riechert, Francesco Beretta und 
Georg Bruseke. 7-14. Leipzig, 2020. Zugriff am 20.07.2021. http://ceur-ws.org/Vol-2532/ 
paperi.pdf. 


„Ich glaube, Fakt ist...“: — 189 


Regesta Imperii. „Richtlinien für die Registrierung von Urkunden (1978).“ In Die Regesta Impe- 
rii im Fortschreiten und Fortschritt (Forschungen zur Kaiser- und Papstgeschichte des Mit- 
telalters 20). Hg. v. Harald Zimmermann. 87-94. Köln, 2000.Rüsen, Jörn. Grundzüge einer 
Historik. Il. Göttingen: Vandenhoeck & Ruprecht, 1986. 

Rüsen, Jörn. Geschichte denken: Erläuterungen zur Historik. Wiesbaden: Springer VS, 2020. 

Sahle, Patrick. Digitale Editionsformen: zum Umgang mit der Überlieferung unter den Bedin- 
gungen des Medienwandels. Teil 3: Textbegriffe und Recodierung. Schriften des Instituts 
für Dokumentologie und Editorik 9. Norderstedt: Books on Demand, 2013. 

Schreurs, Anna, Carsten Blüm und Thorsten Wübbena (eds.). Sandrart.net: Eine netzbasierte 
Forschungsplattform zur Kunst- und Kulturgeschichte des 17. Jahrhunderts. Wolfenbüttel: 
Herzog-August-Bibliothek, [2012]. Zugriff am 20.07.2021. http://www.sandrart.net/de. 

Searle, John R. „Social ontology: Some basic principles.“ Anthropological theory 6/1 (2006): 
12-29. doi: 10.1177 /1463499606061731. 

Stollberg-Rilinger, Barbara. Des Kaisers alte Kleider: Verfassungsgeschichte und Symbolspra- 
che des Alten Reiches. 2., durchgesehene und aktualisierte Edition. Miinchen: C.H.Beck, 
2013. 

Thaller, Manfred. „Reproduktion, Erschließung, Edition, Interpretation: Ihre Beziehungen in 
einer digitalen Welt.“ In Vom Nutzen des Edierens: Akten des internationalen Kongresses 
zum 150-jährigen Bestehen des Instituts für Österreichische Geschichtsforschung, Wien, 
3.-5. Juni 2004. Hg. v. Brigitte Merta, Andrea Sommerlechner und Herwig Weigl. (Wien: 
Oldenbourg, 2005), 205-227. 

Thaller, Manfred. „Historical Information Science: Is there such a Thing? New Comments on an 
old Idea [1993].“ Historical Social Research/Historische Sozialforschung, Supplement 29 
(2017): 260-286. doi: 10.12759/hsr.suppl.29.2017.260-286. 

Tomasi, Francesca. „L’informazione digitale e il Web semantico. Il caso delle scholarly digital 
editions.“ In Informatica umanistica: risorse e strumenti per lo studio del lessico dei beni 
culturali. (A cura di) Valeria Zotti und Ana Pano Alamän, 157-174. Firenze: Firenze Univer- 
sity Press, 2017. 

Torstendahl, Rolf. „Fact, Truth, and Text: The Quest for a Firm Basis for Historical Knowledge 
Around 1900.“ History and Theory 42/3 (2003): 305-331. doi: 10.1111/1468-2303.00246. 

Tschiggerl, Martin, Thomas Walach und Stefan Zahlmann. Geschichtstheorie. Wiesbaden: 
Springer Fachmedien Wiesbaden, 2019. doi: 10.1007/978-3-658-22882-8. 

van Zundert, Joris J. „Screwmeneutics and Hermenumericals: The Computationality of Herme- 
neutics.“ In A New Companion to Digital Humanities. Hg. v. S. Schreibman, R. Siemens, 
und J. Unsworth, 331-347. John Wiley & Sons, Ltd., 2015. doi: 10.1002/9781118680605. 
ch23. 

Virmond, Wolfgang (unter Mitarbeit von Holden Kelm). „Schleiermachers Tageskalender 1808- 
1834.“ Hg. v. Elisabeth Blumrich, Christiane Hackel und Wolfgang Virmond. Berlin-Bran- 
denburgische Akademie der Wissenschaften, Berlin. Zugriff am 23.07.2021. https://schlei 
ermacher-digital.de/tageskalender/index.xql. 

Vogeler, Georg. „The ‚Assertive Edition‘.“ International Journal of Digital Humanities 1/2 
(2019): 309-322. doi: 10.1007/s42803-019-00025-5. 

Wettlaufer, Jörg, Christopher Johnson, Martin Scholz, Mark Fichtner und Sree Ganesh Thotem- 
pudi. „Semantic Blumenbach: Exploration of Text-Object Relationships with Semantic 
Web Technology in the History of Science.“ Digital Scholarship in the Humanities 30 
(supl_1) (2015): i187-i198. doi: 10.1093/Ilc/fqv047. 

Wikipedia. „Tatsache.“ Zugriff am 20.07.2021. https://de.wikipedia.org/wiki/Tatsache. 


Silke Schwandt 

Geschichte visualisieren: Digitale Praktiken 
in der Geschichtswissenschaft als 
Praktiken der Wissenschaftsreflexion 


Abstract: Digitization and digital data play a major role in our society today and 
also have a strong impact on our scholarly practices. This paper will take a 
closer look at how practices in historical scholarship are changing and thus 
how we are currently able to conceptualize and analyze historical change as a 
research object in historical scholarship. Practices of visualization in the hu- 
manities serve as an example to demonstrate the transformation of our schol- 
arly practices. It will be shown how conceptions of change associated with digi- 
tization and new digital methods can be brought together in historical research: 
How are our practices of theorizing change evolving in the digital age? 


Keywords: visualization, history, time, change, practice 


Zusammenfassung: Digitalisierung und digitale Daten spielen eine große Rolle 
in unserer heutigen Gesellschaft und haben auch einen starken Einfluss auf un- 
sere wissenschaftliche Praxis. Der Beitrag wird sich näher damit befassen, wie 
sich geschichtswissenschaftliche Praktiken und damit die Art und Weise verän- 
dern, wie wir gegenwärtig in der Lage sind, historischen Wandel als For- 
schungsgegenstand in der Geschichtswissenschaft zu konzeptualisieren und zu 
analysieren. Praktiken der Visualisierung in den Geisteswissenschaften dienen 
als Beispiel, um die Transformation unserer Wissenschaftspraxis zu demonstrie- 
ren. Es wird gezeigt, wie sich die mit der Digitalisierung verbundenen Konzep- 
tionen des Wandels und die neuen digitalen Methoden in der historischen For- 
schung zusammenführen lassen: Wie entwickeln sich unsere Praktiken der 
Theoretisierung von Wandel im digitalen Zeitalter? 


Schlagwörter: Visualisierung, Geschichte, Zeit, Wandel, Praktiken 
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1 Doing History Digitally: „Geschichte“ und 
„Wandel“ im digitalen Zeitalter 


Die Frage, was Geschichtswissenschaftler:innen eigentlich tun, ist oft beantwor- 
tet worden und entzieht sich fast genauso oft trotzdem einer klaren Definition. 
Jürgen Kocka hat 2008 formuliert: „Geschichte gehört in sehr unterschiedlichen 
Formen zum Leben. [...] Wer sich und seine Welt verstehen und sich in ihr ver- 
halten will, kommt ohne Geschichte nicht aus.“! Das bezieht sich vor allem auf 
das, was Jürgen Sarnowsky 2016 als „‚Wissensarchive‘ der Menschheit“ be- 
schrieben hat: die Funktion der Geisteswissenschaften im Allgemeinen und der 
Geschichtswissenschaft im Besonderen als ein Archiv, das als ein „kollektives, 
sich selbst reflektierendes, ‚kulturelles Gedächtnis der Menschheit‘“ diene.” Der 
Gegenstand dieser Geschichtswissenschaft ist die Auseinandersetzung mit der 
Vergangenheit und dem, was man historische Fakten nennt. Schon Edward 
Carr hat sich in einem inzwischen als Klassiker geltenden Werk zur Frage „Was 
ist Geschichte?“ mit der Frage nach dem Wesen dieser Fakten auseinanderge- 
setzt und Geschichte als einen Prozess der Wechselwirkung zwischen Tatsachen 
und Interpretationen, „zwischen dem Historiker und seinen Fakten“ beschrie- 
ben, der „ein unendlicher Dialog zwischen Gegenwart und Vergangenheit“ sei.’ 
Zentral für diesen Dialog sei stets die Standortgebundenheit der Historikerin 
oder des Historikers: „Only if the empirical evidence of the past is shaped ac- 
cording to the standpoints of those who communicate in the realm of historical 
consciousness and according to the value system which is derived from this 
standpoint does it acquire the quality of a plausible history; neutrality is the 
end of history.“* Diese Standortgebundenheit betrifft aber nicht allein die Zu- 
richtung von Ereignissen und historischen Fakten, sondern auch das Bild der 
Geschichte selbst - und eng damit verbunden die Frage nach „Zeit“ und „Wan- 
del“. Geschichtswissenschaft beschäftigt sich zentral mit der Beschreibung der 
Wahrnehmung von Wandlungsprozessen sowie mit deren Erklärung. „Doing 
History“ — Geschichte machen - ist also immer auch die Konzeptualisierung von 
Zeit und Wandel. Gerade diese Konzepte sind es, die im Zeitalter der Digitalisie- 
rung neu diskutiert werden müssen. Welchen Einfluss hat die Digitalisierung 


1 Jürgen Kocka, „Geschichte als Wissenschaft,“ in Geschichte: Studium, Wissenschaft, Beruf, 
hg. v. Gunilla Budde (Berlin: Akad.-Verl., 2010), 12. 

2 Jürgen Sarnowsky, „Was sind und zu welchem Ende studiert man Geisteswissenschaften?, “ 
http://mittelalter.hypotheses.org/7972. Zugriff am 02.08.2021. 

3 Edward H. Carr, Was ist Geschichte?, 6. Aufl. (Stuttgart u.a.: Kohlhammer, 1981), 30. 

4 Jörn Rüsen, „Historical Objectivity as a Matter of Social Values,“ in Historians and Social 
Values, hg. v. Joep Leerssen (Amsterdam: Amsterdam Univ. Press, 2000), 63. 
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auf unsere Wahrnehmung von Zeit? Welche neuen Praktiken zur Konzeptuali- 
sierung von Zeit und Wandel ergeben sich unter digitalen Bedingungen und 
mithilfe von digitalen Methoden? Wie verändert sich der Standort der Histori- 
ker:innen unter dem Paradigma der Digital History? 

Moderne Gesellschafts- und Geschichtstheorien sprechen oft von Beschleu- 
nigungswahrnehmung, wenn es um Geschichte und Wandel im digitalen Zeit- 
alter geht. Hartmut Rosa sieht die Moderne dem Prinzip der Dynamisierung un- 
terworfen, die ihrerseits von Beschleunigung geprägt ist,’ und schreibt den 
„neueren Beschleunigungsdiskurs“ seit 1989 auch der von ihm so genannten 
digitalen Revolution zu.® 

Reinhart Koselleck korreliert in seinem Entwurf der Zeitschichten technolo- 
gische und soziale Beschleunigung in folgender Weise: Er behauptet, dass die 
Erfahrung beschleunigten Wandels nicht notwendigerweise mit technologi- 
schem Fortschritt verbunden sei, wie man vermuten könnte: Die Erwartung von 
Beschleunigung im Sinne einer antizipierten, ja erhofften Verkürzung der Zeit 
gebe es seit der jüdisch-christlichen apokalyptischen Literatur, aber tatsächli- 
che Beschleunigung, die das Potenzial hat, die Realität zu verändern, gebe es 
erst in der technologisch geprägten Neuzeit.’ Insofern müssten technologische 
Beschleunigung und gesellschaftliche Beschleunigung getrennt voneinander 
betrachtet werden, auch wenn das Gefühl der Beschleunigung, das unsere ge- 
genwärtige Zeitwahrnehmung präge, mit der Technologisierung unserer Welt 
verbunden sein mag, damit aber nicht gleichzusetzen sei.® 

Paul Virilio beschäftigt sich in seinem im Jahr 1999 auf Englisch erschiene- 
nen Essay „Polar Inertia“ mit der Rolle der Technologie in unserem Verständnis 
von Zeit. Er behauptet: ,,[...] in our ordinary everyday life, we are passing from 
the extensive time of history to the intensive time of an instantaneity without 
history made possible by the technologies of the hour.“? In gewisser Weise lässt 
sich dieser Gedanke mit dem verbinden, was andere Theoretiker das „Ende der 
Geschichte“ genannt haben. Während Francis Fukuyama das Ende der Ge- 
schichte darin sah, dass wir mit der Demokratie die ultimative Regierungsform 


5 Vgl. Hartmut Rosa, Beschleunigung: Die Veränderung der Zeitstrukturen in der Moderne, 11. 
Aufl., (Frankfurt a.M.: Suhrkamp, 2016), 430. 

6 Rosa, Beschleunigung, 40. 

7 Reinhart Koselleck, „Einleitung,“ in Zeitschichten: Studien zur Historik, hg. v. Reinhart Kosel- 
leck (Frankfurt a.M.: Suhrkamp, 2003), 15. 

8 Koselleck, „Einleitung,“ 15. 

9 Paul Virilio, Polar Inertia, Published in association with Theory, Culture & Society (London: 
Sage Publications, 1999), 9. 
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erreicht haben,’ sieht Virilio das Ende der Geschichte im Verständnis der Zeit 
als „instantaneity without history“ sowie in der Herrschaft der modernen Tech- 
nologie.” Leben wir also in einer Zeit des „ewigen Jetzt“? 

Francois Hartog bezeichnet das gegenwärtige zeitliche Regime als das eines 
Präsentismus, in dem wir unsere Beziehung zur Vergangenheit und zur Zukunft 
verloren haben.” Hartog betont, dass es die soziale Position oder der Stand- 
punkt sei, der das Empfinden von und die Perspektive auf Zeit präge. Was für 
den einen ein Gefühl von Beschleunigung und Globalisierung darstelle, könne 
sich für den anderen wie Stagnation und der Verlust jeglicher Zukunftsperspek- 
tive anfühlen. Statt das digitale Zeitalter als das Ende der Zeit oder unsere Ge- 
genwart als das ‚ewige Jetzt‘ zu sehen, plädiert Helge Jordheim für ein Verständ- 
nis von Zeit als „a new multiplicity of time“, der wir „in the new immediacies 
and accelerating rhythms of digital technology“ gegenüberstehen. Es seien 
Praktiken der Synchronisation, der Vergleichzeitigung, die der Instabilität einer 
Vielzahl von Zeiten entgegenwirke.'* Für Jordheim sind die Vielheit der Zeit und 
die Praktiken der Synchronisation zwei Teile derselben Gleichung, die Koselleck 
als „Gleichzeitigkeit des Ungleichzeitigen“ gerahmt hat.” Dabei ist Synchroni- 
sation eine soziale und kulturelle Praxis, etwas sozial und kulturell Konstruier- 
tes, das Orientierung in der Vielfalt der Zeiten bietet. Sie soll dem Gefühl der 
Zeitlosigkeit oder der Unmittelbarkeit der Gegenwart etwas entgegensetzen. 

Als soziale Praxis betrifft Synchronisation die Gesellschaft als Ganzes. Zeit 
und Raum sind die materiellen Grundlagen der Gesellschaft und werden durch 
neue Technologien und Praktiken transformiert. Manuel Castells beschreibt die- 
se Transformation als den Beginn der „Netzwerkgesellschaft“.!° Der Handel und 
insbesondere die stark technologisierten Praktiken der Börse, die auch von Ka- 
rin Knorr Cetina als Motoren des (gesellschaftlichen) Wandels beschrieben wur- 


10 Francis Fukuyama, The End of History and the Last Man: With a New Afterword, 1. Free 
Press trade paperback ed., [Nachdr.] (New York, NY: Free Press, 2006). 

11 Virilio, Polar Inertia, 78. 

12 Francois Hartog, Regimes of Historicity: Presentism and Experiences of Time, (New York: 
Columbia University Press, 2017). 

13 Helge Jordheim, Introduction: Multiple Times and the Work of Synchronization, History 
and Theory 53 (2014): 499. 

14 Jordheim, „Introduction: Multiple Times and the Work of Synchronization,“ 502. 

15 Reinhart Koselleck, „‚Neuzeit‘: Zur Semantik moderner Bewegungsbegriffe,“ in Vergangene 
Zukunft: Zur Semantik geschichtlicher Zeiten, hg. v. Reinhart Koselleck, 1. Aufl., Theorie (1979), 
325. 

16 Manuel Castells, The Rise of the Network Society, 2. Aufl., with a new pref., [Nachdr.], 3 
vols., The Information Age Economy, Society and Culture / Manuel Castells; Vol. 1 (Chichester: 
Wiley-Blackwell, 2010), doi: 10.1002/9781444319514. 
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den,” beeinflussen Konzepte von Zeit und Raum grundlegend. Raum wird in 
Netzwerken aufgelöst, Zeit wird zeitlos in Netzwerken von Strömen, die Vergan- 
genheit und Zukunft ignorieren. Castells analysiert: „infinite social distance is 
created between this meta-network and most individuals, activities, and locales 
around the world.“'® Er geht so weit, zu behaupten, dass es nicht mehr Men- 
schen oder Praktiken seien, sondern ,,[...] unseen logic of the meta-network 
where value is produced, cultural codes are created, and power is decided.“!? 
Zeit und Raum scheinen sich unserer Kontrolle zu entziehen und werden gleich- 
zeitig durch soziale Interaktion geschaffen, wobei sich diese soziale Interaktion 
im digitalen Zeitalter grundlegend verändert hat. Die virtuelle Kommunikation 
über das Internet und in sozialen Medien macht Zeit und Raum fluide wie nie 
zuvor. Wir können zu jeder Zeit überall sein und trotzdem an dem teilnehmen, 
was Castells „a purely cultural pattern of social interaction and social organiza- 
tion“ nennt.” Das scheint der Moment der ultimativen Gleichzeitigkeit zu sein. 

Aber (nicht nur) als Historiker:in muss man fragen: Wie stellen sich, unter 
der Prämisse dieser Diagnosen, Konzepte des Wandels dar? Leben wir in einer 
präsentistischen Gesellschaft, die die Vergangenheit ignoriert und Angst vor 
der Zukunft hat? Hat die Beschleunigung unserer Gesellschaft zu einem Mo- 
ment der Unmittelbarkeit ohne Geschichte geführt? Folgen wir nur noch den 
Strömen des Netzes? 


2 Geschichte visualisieren: Vergleichzeitigung 
im Bild? 


Geschichte zu visualisieren ist keine neue Idee. Helge Jordheim erinnert uns dar- 
an, dass schon im Laufe des 18. Jahrhunderts synchronisierende Tabellen zu den 
Werken der Universalgeschichte gehörten.” Es gibt aber auch neuere Beispiele. 
Im Jahr 1952 veröffentlichte Arno Peters, ein deutscher Historiker und Karto- 
graph, seine Synchronoptische Weltgeschichte, die hauptsächlich aus verschiede- 
nen Tabellen besteht (so genannte Zeittafeln), die verschiedene Ereignisse in 


17 Karin K. Cetina und Alex Preda, „The Temporalization of Financial Markets: From Network 
to Flow,“ Theory, Culture & Society 24/7-8 (2007), 10.1177/0263276407084700. 

18 Castells, The Rise of the Network Society, 507. 

19 Ibid., 508. 

20 Ibid. 

21 Jordheim, „Introduction: Multiple Times and the Work of Synchronization,“ 515. 
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Screenshot von ddp (Der Digitale Peters) mit Daten fiir das vierzehnte Jahrhundert CE. 


Abb. 1 
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verschiedenen Regionen der Welt zeigen, die zur gleichen Zeit stattfanden.” 
Diese umfasst den Zeitraum von 3000 v. Chr. bis 2000 n. Chr. und zeigt auf je- 
der Doppelseite jeweils ein Jahrhundert. Peters kategorisiert die Ereignisse und 
Prozesse, die er katalogisiert, in vier Hauptkategorien: Wirtschaft, Geistesleben, 
Politik und Krieg beziehungsweise Revolutionen. Der Mittelteil jeder Seite ist 
den Lebenslinien von zeitgenössischen Persönlichkeiten aus diesen Bereichen 
gewidmet. 

Die in Abbildung 1 dargestellte synchrone Ansicht? der Geschichte des vier- 
zehnten Jahrhunderts ermöglicht es uns, Ereignisse zu sehen, die in verschiede- 
nen Teilen der Welt zur gleichen Zeit stattfanden sowie die Lebenslinien von 
Menschen, die Zeitgenossen waren, sich aber vielleicht nie getroffen haben. Sie 
suggeriert eindeutig eine Synchronizität von Ereignissen und vielleicht sogar 
eine Vielzahl von Zeiten [multiplicity of times], die durch die Visualisierung 
synchronisiert werden. In diesem Sinne ist die Abbildung mehr als nur eine Il- 
lustration. Sie bietet durch die Art der Darstellung zusätzliche Informationen 
über die dargestellten Daten und kann auf explorative Weise verwendet wer- 
den, um weitere Einsichten hervorzurufen.”* Um die Recherche mit diesem 
Werkzeug weiter zu erleichtern, enthält die digitalisierte Version der „Synchro- 
noptischen Weltgeschichte“, die 2010 veröffentlicht wurde, Notizen und Kartei- 
karten, die von Peters und seinem Team während des Schreibprozesses ge- 
schrieben wurden.” So können Nutzer:innen nicht nur von einer synchronen 
Sicht auf die Geschichte profitieren, sondern auch einen Einblick in die Ent- 
scheidungen und Ideen gewinnen, die der Konzeption der Weltgeschichte zu- 
grunde liegen. 


3 Visualisierungen in den Geisteswissen- 
schaften: Versuch einer Einordnung 


Visualisierungen in den Geisteswissenschaften fordern unsere Wissenschafts- 
praktiken auf mehreren Ebenen heraus. Ausgehend von der geschichtswissen- 


22 Arno Peters, Synchronoptische Weltgeschichte (Frankfurt a.M.: Universum-Verlag, 1952). 
23 Arno Peters et al., Der digitale Peters: Arno Peters synchronoptische Weltgeschichte, Pro- 
grammversion DDP-2010-03 (Wiener Neudorf, Wiesbaden: ÖBZ; Büro W, 2010). 

24 Vgl. Martyn Jessop, „Digital Visualization as a Scholarly Activity,“ Literary and Linguistic 
Computing 23/3 (2008), doi: 10.1093/llc/fqn016 über die Unterscheidung zwischen „Illustrati- 
on“ und „Visualisierung“ und deren explorativen Wert für die Informationsgenerierung. 

25 Peters et al., Der digitale Peters. 
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schaftlichen Aufgabe der Beschreibung, Interpretation und auch Konzeption 
von Wandel und (historischer) Zeit stellt sich die Frage, welchen Mehrwert das 
Visualisieren haben kann. 

Abbildung 1 oben konstituiert eine synchrone Betrachtung durch die gleich- 
zeitige Darstellung verschiedener Aspekte oder Ereignisse, die im Wesentlichen 
durch den Vergleich im Hinblick auf das Datum ihres Auftretens miteinander in 
Verbindung gebracht werden. Auch wenn dies alles in einem Bild geschieht 
und nicht der Vergleich mehrerer Bilder im Mittelpunkt steht, kann die Praxis 
der Synchronisation als „vergleichendes Sehen“ konzipiert werden. Johannes 
Grave hat dieses Konzept für die Kunstgeschichte entwickelt und warnt davor, 
sich auf das Herausgreifen und Isolieren bestimmter Elemente eines Bildes zu 
konzentrieren, obwohl er vermutet, dass Praktiken der vergleichenden Betrach- 
tung die Tendenz haben, ein Bild in verschiedene, kleinere Elemente zu zerle- 
gen, die sich leichter vergleichen lassen.” Für die Kunstgeschichte würde dies 
der Annahme widersprechen, dass ein Bild eine Botschaft als Ganzes vermittele. 
Gilt das auch für (geistes-)wissenschaftliche Visualisierungen? 

Es scheint notwendig zu sein, zwischen Bildern und Visualisierungen, zwi- 
schen asthetischer und wissenschaftlicher Bildgebung zu unterscheiden - auch 
wenn die Unterscheidung am Ende irreführend sein könnte. Bettina Heintz und 
Jörg Huber haben fünf Kriterien für eine solche Unterscheidung vorgeschlagen, 
die dabei helfen, die produktive Kapazität wissenschaftlicher Visualisierungen 
als Werkzeuge für geisteswissenschaftliche Forscher:innen herauszuarbeiten: 
Visualisierungen sind Werkzeuge. Sie unterscheiden sich von (künstlerischen) 
Bildern in Fragen der Indexikalität, der Interikonizität, der Performativität sowie 
als Produkte von Mensch-Maschine-Interaktion.”’ Jorg Huber betont ihre „Voll- 
zugsorientiertheit“ im Gegensatz zur Selbstreferenzialität eines künstlerischen 
Bildes.” Sie hätten zwar ästhetische Qualitäten, diese würden aber in der Regel 
nicht als Aufwertung der Aussage einer Visualisierung interpretiert. Visualisie- 
rungen schafften dagegen wissenschaftliche Legitimität durch visuelle Evidenz, 
eine Funktionalität, die ihr eigenes soziokulturelles Gewicht hat.” Während Bil- 


26 Johannes Grave, „Vergleichen als Praxis: Vorüberlegungen zu einer praxistheoretisch ori- 
entierten Untersuchung von Vergleichen,“ in Die Welt beobachten: Praktiken des Vergleichens, 
hg. v. Angelika Epple und Walter Erhart (Frankfurt a.M. u.a.: Campus Verlag, 2015), 151. 

27 Vgl. Bettina Heintz und Jörg Huber, „Der verführerische Blick: Formen und Folgen wissen- 
schaftlicher Visualisierungsstrategien,“ in Mit dem Auge denken: Strategien der Sichtbarma- 
chung in wissenschaftlichen und virtuellen Welten. Theorie - Gestaltung 1, hg. v. Bettina Heintz 
und Arnold Benz (Zürich: Ed. Voldemeer, 2001). 

28 Heintz und Huber, „Der verführerische Blick,“ 28. 

29 Ibid., 29. 


Geschichte visualisieren —— 199 


der auf etwas Äußeres verwiesen, seien Visualisierungen Modelle, die nicht ab- 
schließend durch die Objekte bestimmt sind, die sie darstellen sollen.*° 

Da wissenschaftliche Visualisierungen zwangsläufig nicht eine gegebene 
Realität abbilden, sondern auf Messdaten und Algorithmen der Bilderzeugung 
verweisen, sind ihre Referenzen Daten und Software, nicht die Realität.” Den- 
noch bleibt der Eindruck, dass Visualisierungen die Wahrheit sichtbar machen - 
erst recht, wenn sie automatisch generiert werden. Heintz spricht von einer „Il- 
lusion der [...] Objektivität“, die diesen Bildern innewohne,” die aber unbedingt 
hinterfragt werden müsse. Auch Algorithmen sind menschengemacht und un- 
terliegen kulturellen Konventionen, auch wenn ihnen oft ein hohes Maß an Evi- 
denz zugeschrieben und Vertrauen entgegengebracht wird. Auch die Visualisie- 
rungen selbst sind an Konventionen gebunden.” Das hat mit der Mensch- 
Maschine-Interaktion zu tun, die für Prozesse der computerbasierten Bilderzeu- 
gung grundlegend ist. Wer entwirft und produziert eine Visualisierung? „Die 
Macht der Apparatur liegt in der Visualisierung, die Kompetenz des Forschers 
bleibt bei der gestalteten Darstellung und damit bei der Interpretation.“ Betti- 
na Heintz nennt dieses Zusammenspiel von Bilderzeugung und visueller Inter- 
pretation einen „genuin experimentellen Prozess“. Während sie diesen Pro- 
zess als einen problematisiert, bei dem die Bildinformation „verändert, gefiltert, 
geglättet und angepasst wird, bis eine Relation zwischen dem Erwarteten und 
dem Dargestellten besteht“ — kurz: manipuliert wird, bis es zur Geschichte 
passt —, sieht Martyn Jessop weitere Vorteile und neue Potenziale im Einsatz 
von Visualisierungswerkzeugen für die geisteswissenschaftliche Forschung. Er 
behauptet, dass diese Werkzeuge die Fähigkeiten hätten „to allow visual per- 
ception to be used in the creation or discovery of new knowledge.“ Die Be- 
schäftigung mit Visualisierungen ist seiner Ansicht nach ein dynamischer Pro- 
zess, der auch erkenntnistheoretische Fragen zur Visualisierung aufwirft.*” Aus- 
schlaggebend ist hier die Performativität der Visualisierung. Das Visualisieren 
von Informationen erzeugt neue Informationen - es ist keine bloße Illustration, 
sondern demonstriert die Verschiebung in der Praxis der Bilderzeugung „von 
der Ontologie des Bildes zur Performativität des Bildes, von der formalen Quali- 


30 Ibid., 12. 

31 Ibid., 30. 

32 Ibid., 19. 

33 Vgl. auch Katharina Zweig, Ein Algorithmus hat kein Taktgefühl: Wo künstliche Intelligenz 
sich irrt, warum uns das betrifft und was wir dagegen tun können (München: Heyne, 2019). 
34 Heintz und Huber, „Der verführerische Blick,“ 31. 

35 Ibid., 23. 

36 Jessop, „Digital Visualisation as a Scholarly Activity,“ 282. 

37 Ibid. 
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tät zur kommunikativen Funktion.“** Martyn Jessop fügt hinzu, „that an image 


can only be a true visualization when it is the primary carrier of information. “3? 

Aber warum Geschichte visualisieren? Das Argument war bisher, dass syn- 
chronisierende Visualisierungen uns erlauben, Zeit und Wandel anders zu 
sehen, dass die Visualisierung eine Praxis der Vergleichzeitigung ist. Visualisie- 
rungen sind Datenmodelle. Sie umfassen und komprimieren große Datenmen- 
gen zu einem Bild, das diese Daten gleichzeitig in einer räumlichen Konfigura- 
tion präsentieren kann.“ Es ist dieses Zusammentreffen von Ereignissen, diese 
Verdichtung von Informationen, die Visualisierungen für die geisteswissen- 
schaftliche Forschung produktiv macht. Wenn wir Abbildung 1 betrachten, se- 
hen wir Dinge, die wir vorher vielleicht nicht in Relation gesehen haben, und 
das löst neue Forschungsfragen und damit neue historische Erkenntnisse aus. 
Wenn es stimmt, dass Visualisierungen mit uns kommunizieren, indem sie un- 
sere Erwartungen konfrontieren, dann ist es das Brechen dieser Erwartung 
durch Irritation, das Wissen schafft.*' Genau in dieser kreativen Chance liegt 
auch die größte Herausforderung für den Einsatz von Visualisierungen in der 
geisteswissenschaftlichen Forschung. 

Noah Bubenhofer formuliert drei kritische Thesen zu Visualisierungsprakti- 
ken in den Digital Humanities: Erstens entsprächen Visualisierungen einem 
„utilitaristischen und positivistischen Denkstil“, der mit den Geisteswissen- 
schaften nicht vereinbar sei. Sie kämen aus einem ganz anderen wissenschaft- 
lichen Paradigma, nämlich dem der Naturwissenschaften. Zweitens unter- 
schätzten Geisteswissenschaftler:innen die Bedeutung der technischen und al- 
gorithmischen Grundlagen von Visualisierungsmethoden. Die Frage, ob ein 
Verständnis von Programmierung und anderen Praktiken der Informatik not- 
wendig sei, um Visualisierungen zu nutzen und zu interpretieren, sei obendrein 
sehr umstritten.“ Jenna Burrell weist darauf hin, dass ,,[...] the workings of ma- 
chine learning algorithms can escape full understanding and interpretation by 
humans, even for those with specialized training, even for computer scien- 
tists.““? Was bedeutet das aber für den wissenschaftlichen Forschungsprozess 


38 Ibid., 35. 

39 Ibid., 283. 

40 Heintz und Huber, „Der verführerische Blick,“ 13. 

41 Vgl. zur Idee der produktiven Irritation durch computergestützte Methoden in der Ge- 
schichtswissenschaft: Silke Schwandt, „Methoden für die Historische Semantik,“ Geschichte 
und Gesellschaft 44/1 (2018), doi: 10.13109/gege.2018.44.1.107. 

42 Noah Bubenhofer, „Drei Thesen zu Visualisierungspraktiken in den Digital Humanities,“ 
Rechtsgeschichte - Legal History 24 (2016), doi: 10.12946/rg24/351-355, 351. 

43 Jenna Burrell, „How the Machine ‚Thinks‘: Understanding Opacity in Machine Learning 
Algorithms,“ Big Data & Society 3/1 (2016), doi: 10.1177/2053951715622512, 10. 
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und unsere Praktiken? Die Anwendung von algorithmischen Verfahren in der 
Geschichtswissenschaft verlangt nach einer prazisen Beschreibung dessen, was 
diese überhaupt leisten sollen — es bedarf also einer Analyse der eigenen For- 
schungspraxis, um von den neuen Methoden zu profitieren, so hat es schon 
John Unsworth gefordert.“ Wenn wir uns dann aber nicht um ein Verständnis 
der algorithmischen Verfahren bemühen, geben wir die Kontrolle über einen 
Teil unseres Forschungsprozesses ab. Hier ist die Reflexion der eigenen Wissen- 
schaftspraxis besonders wichtig. Was machen wir eigentlich, wenn wir als Geis- 
teswissenschaftler:innen forschen? 

Bubenhofer konstatiert drittens, dass die Programmierung von Visualisie- 
rungswerkzeugen dazu neigt, traditionelle Interpretationsmethoden nachzuah- 
men, anstatt die Chancen eines neuen datengetriebenen Paradigmas zu nut- 
zen.” Auch Franco Moretti, einer der wichtigsten Pioniere auf dem Gebiet der 
digitalen Literaturwissenschaft, warnt vor dem Auseinanderfallen von neuen 
Methoden und Daten auf der einen Seite und alten Methoden auf der anderen: 
„Algorithms generate new facts, whose interpretation continues however to rely 
on a different hermeneutic tradition.““° 

Abgesehen von der offenen Frage, ob Visualisierungen wie Bilder behandelt 
werden können oder ob wir Algorithmen verstehen müssen, um Visualisierun- 
gen zu nutzen, bleibt die Tatsache bestehen, dass Visualisierungspraktiken in 
den Geisteswissenschaften neue Herausforderungen darstellen und neue Per- 
spektiven bieten. 


4 Geschichte auf einen Blick: Methoden und 
Interpretationen 


Visualisierungen sind Komprimierungen von großen Datenmengen in einem 
einzigen Bild. Auf diese Weise sind sie Datenmodelle, „a corrected, rectified, re- 
gimented, and in many instances idealized version of the data we gain from im- 


44 John Unsworth, „Scholarly Primitives: What Methods Do Humanities Researchers Have in 
Common, and How Might Our Tools Reflect This?,“ https://johnunsworth.name/Kings.5-00/pri 
mitives.html. Zugriff am 19.02.2022. 

45 Vgl. Bubenhofer, „Drei Thesen zu Visualisierungspraktiken in den Digital Humanities,“ 351. 
46 Franco Moretti, „Patterns and Interpretations,“ Pamphlets of the Stanford Literary Lab 15 
(2017): 6. 
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mediate observation, the so-called raw data.“ Wie passt das zu unserem vor- 
herigen Beispiel der visualisierten Geschichte? Welche Rohdaten liegen dem 
„Digitalen Peters“ zugrunde? 

Historische Ereignisse oder Entwicklungen sowie die Informationen zu his- 
torischen Persönlichkeiten, die Peters und sein Team recherchierten, wurden 
auf Karteikarten dokumentiert. Abbildung 2 zeigt eine Karteikarte für das Jahr 
1331, dem Jahr des ersten dokumentierten Einsatzes von Kanonen in Europa, 
auf italienisch-deutschem Grenzgebiet im Friaul. Neben dem Ereignis sind auf 
der Karte auch die Informationsquellen, die weiteren wirtschaftlichen und tech- 
nologischen Entwicklungen im Zusammenhang mit der Verwendung von 
Schießpulver im vierzehnten Jahrhundert in Europa und sogar das Entstehungs- 
datum der Karteikarte selbst vermerkt (10.5.51). 


| Startseite Zeitkarte || Verbindungen || Recherche Kartei [Analyse Synchronopse | 
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Die erste historisch sicher beglaubigte Anwendung von Pulver- 
waffen in Europa 1331 z.Zt., Iuäwigs des Bayern, auf italienisch- 
deutschem Grenzgebiet, in Friaul als die beiden Ritter de Orus- 
pergo und de Spilimbergo die Stadt Cividele engriffen. Ausdrücke 
der Chronik ponentes vasa = Büchsen (1; 2). 

1334 berichtet die Chronik von Este, dass der Markgraf eine gros- 
se Menge von Geschützen verschiedener Art habe anfertigen lessen 
(vasa u. sclopeta bedeuten sicher Feuerwaffen) (l; 2). 

Das drittälteste sichere Zeugnis in päpstlichen Rechnungen, Da- 
nach wurden 1340 bei Belagerung von Terni vom päpstlichen Heer 
probeweise Donnerbüchsen verwandt, die Bolzen schossen, und 1350 
bei Belagerung der Burg Saluerolo Bombarden, die eiserne Kugeln 
von etwa 300 g Gewicht schossen (1). 

Wo und von wem die erste Schusswaffe konstruiert wurde, bleibt im 
Dunkeln; nur die Zeit, um 1300, iet ungefähr zu bestimmen; als 
Lend der Intdeckung wird Oberitalien anzusehen sein. Einige Jahre 
später als in Italien erscheinen die ersten Nachrichten von Don- 
nerbüchsen in Frankreich 1339, in England 1338 (Schiesspulver u, 
verschiedene Arten von Geschützen 1338 in einem Iieferungskontrakt 
er in Spanien 1342, 1346 in Stadtrechnungen von Aachen 
usw, (1 


Dew, 


Abb. 2: Screenshot einer Karteikarte mit der Überschrift „Pulvergeschosse (Kanonen) in Friaul 
(Italien) verwendet“ aus ddp. 


47 Roman Frigg und Stephan Hartmann, „Models in Science,“ in The Stanford Encyclopedia of 
Philosophy, hg. v. Edward N. Zalta, Spring 2020 (Metaphysics Research Lab, Stanford Univer- 
sity, 2020). 
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Die Daten auf den Karteikarten sind zwar den Visualisierungen der Zeittafeln 
vorangestellt, aber sie sind bereits manipuliert und verändert worden; Fakten 
wurden ausgewählt und nach den bereits vorhandenen Kategorien Wirtschaft, 
Geistesleben, Politik, Krieg und Revolution sortiert. Die Veröffentlichung der 
Karten im Rahmen des „Digitalen Peters“ legt zumindest die der Visualisierung 
zugrundeliegenden Informationen offen und erfüllt die Forderung einiger For- 
scher:innen, bei Visualisierungen nicht nur das transparent zu machen, was 
man sehen kann, sondern auch „what is omitted and the levels of uncertainty 
of that which is present.“"® 

Was die Zeitkarte in Abbildung 1 visualisiert, ist eher ein Zeitverlauf als ein 
Konzept historischen Wandels. Es gibt kein Konzept des Dazwischen, des Uber- 
gangs oder der Transformation. Der dominante Darstellungsmodus ist der der 
linearen Zeit — ein Modell, das Praktiken der Synchronisation widerspiegelt und 
selbst eine lange Geschichte hat. Wie die Historiker des achtzehnten Jahrhun- 
derts fallen wir immer noch unserem Bediirfnis nach einer stabilen Ordnung 
der Ereignisse zum Opfer. Die meisten Visualisierungen folgen diesem Modell, 
es sind Datenmodelle, die die Daten geordnet darstellen, indem sie zum Bei- 
spiel eine regelmäßige Kurve durch eine Menge von Datenpunkten zeichnen.“? 
Dies entspricht dem vermeintlich affirmativen Charakter von wissenschaftli- 
chen Visualisierungen im Gegensatz zum offeneren und selbstreflexiven Cha- 
rakter künstlerischer Bilder. Aber auch Visualisierungen können explorativ und 
kreativ sein. Abbildung 3 zeigt eine andere Art der Visualisierung, die vom „Di- 
gitalen Peters“ angeboten wird. Unter dem Stichwort Verbindungen werden die 
Daten als Zeitscheibe visualisiert. Die Herausgeber der digitalen Version be- 
schreiben die Scheibe als ein Modell eines ‚früheren Jetzt‘ mit der ‚gegenwärti- 
gen Vergangenheit‘ des Freignisses im Zentrum - in diesem Fall der erste doku- 
mentierte Einsatz von Kanonen in Friaul im Jahr 1331. Andere Freignisse oder 
Entwicklungen sowie historische Persönlichkeiten sind auf konzentrischen 
Kreisen um das ausgewählte Ereignis herum angeordnet, wobei die Größe des 
Punktes (genannt Zeitplanet) die Relevanz oder Stärke der Verbindung reprä- 
sentiert, während der Abstand zum Zentrum die zeitliche Distanz anzeigt. Im 
Gegensatz zum Zeitdiagramm gibt es keine Richtung in der Zeit. Eine große 
Entfernung kann gleichbedeutend sein mit einer langen Zeit in der Vergangen- 
heit oder in der Zukunft. Die Anordnung der Zeit in konzentrischen Kreisen 
erinnert wieder an die Zeitschichten von Koselleck. Die Farben der Keile sind 
die gleichen Farben wie im Zeitdiagramm und symbolisieren die Kategorien. 


48 Jessop, „Digital Visualization as a Scholarly Activity,“ 287. 
49 Frigg und Hartmann, „Models in Science.“ 
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Offensichtlich bestehen die meisten Verbindungen zwischen Einträgen inner- 
halb der Kategorie „Wirtschaft“, die in Grün dargestellt ist. 

Die Visualisierung der Zeitscheibe erlaubt es der oder dem Betrachter:in, in 
der interaktiv gestalteten digitalen Version seine Perspektive auf zeitliche Zu- 
sammenhänge zu ändern, indem er ein anderes Ereignis (einen anderen Punkt) 
für die Position in der Mitte des Kreises wählt, um damit die Datensätze und 
ihre Verbindungen zu explorieren. Auf diese Weise verändert sich das Bild und 
damit auch die Perspektive auf die Zeit. Es ist nicht mehr das Ereignis von 1331, 
das die historische Gegenwart repräsentiert. In Abbildung 4 hat sich die ‚Gegen- 
wart‘ auf das Jahr 1420 verlagert, in dem die Hussiten ein neues Geschütz, die 
Haubitze, entwickelten. Einige der umgebenden Zeitplaneten sind gleichgeblie- 
ben, andere haben sich verändert. Das Festlegen eines bestimmten Ereignisses 
als Gegenwart verändert die historischen Schichten von Vergangenheit und Zu- 
kunft. 

Und mit diesem Perspektivwechsel kommen zugleich mehr politische Ent- 
wicklungen (orange dargestellt) in den Blick. Im selben Jahr, 1420, ruft Papst 
Martin V. zum Kreuzzug gegen die Hussiten auf. Mit diesem im Zentrum der 
Scheibe (Abbildung 5) gewinnt der oder die Betrachter:in eine weitere Perspek- 
tive auf die zeitlichen Zusammenhänge des Jahres 1420. Nun dominieren die po- 
litischen Entwicklungen (orange dargestellt) den Blick, während die wirtschaft- 
lichen und technischen Entwicklungen auf einen Nebenschauplatz reduziert 
werden. Die Namen von Zeitgenossen, militärische Auseinandersetzungen (wie 
der Kreuzzug gegen die Hussiten) und Ereignisse aus dem Bereich des Geistesle- 
bens prägen nun das Bild. Vergleicht man die verschiedenen Zeitscheiben, ver- 
ändert sich die Geschichte vor unseren Augen. 

Die vorgestellten Visualisierungen aus dem „Digitalen Peters“ funktionie- 
ren auf zwei Arten: Sie visualisieren Geschichte entweder als lineares, synchro- 
nisiertes, gerichtetes Vergehen der Zeit oder als vielschichtiges Modell, das Zeit 
als ungerichtet darstellt, als etwas, das Verbindungen zwischen singulären Fr- 
eignissen herstellt, ohne sie chronologisch ausrichten zu müssen - dies bleibt 
der oder dem Betrachter:in und der eigenen Wahrnehmung und Interpretation 
überlassen. Letzteres, die Zeitscheibe, könnte auch als Visualisierung einer 
Chronoferenz dienen, wie sie von Achim Landwehr beschrieben wurde.” Ereig- 
nisse werden auf ihre eigenen (historischen) Versionen der Vergangenheit, der 
Gegenwart und der Zukunft bezogen. 


50 Vgl. Achim Landwehr, Die anwesende Abwesenheit der Vergangenheit: Essay zur Geschichts- 
theorie (Frankfurt a.M.: S. Fischer, 2016). 
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5 Digitale Wissenschaftspraktiken: 
Modellieren, Visualisieren und Vergleichen 


Konzepte von Zeit und Wandel sind nie unschuldig. Sie repräsentieren immer 
die Ansichten und Überzeugungen ihrer Autor:innen und ihrer eigenen Zeit, sie 
werden von einem bestimmten politischen, kulturellen oder sozialen Stand- 
punkt aus entworfen; diese Perspektive gilt auch im digitalen Zeitalter und für 
die neuen Möglichkeiten der Visualisierung von Geschichte. Anstatt eine neue 
Sichtweise auf Zeit und Wandel selbst zu präsentieren, hat sich dieser Artikel 
vor allem mit den Praktiken beschäftigt, die mit der Konzeptualisierung und Vi- 
sualisierung von Zeit- und Wandelmodellen verbunden sind. Er will die Bedeu- 
tung der Analyse von wissenschaftlichen Praktiken, von Visualisierungen und 
ihren Voraussetzungen und Ergebnissen hervorheben; es geht um die Forscher: 
innen selbst und ihre Modelle von Geschichte, Zeit und Wandel. 

In diesem Sinne sind auch Visualisierungen nicht unschuldig. Obwohl Bil- 
der oft selbsterklärend, objektiv und evident erscheinen mögen, sind sie Pro- 
dukte von Praktiken. Die dargestellten Daten (in den Geisteswissenschaften 
sind dies meist Textdaten) sind dekontextualisiert, ihre Sequenzialität ist aufge- 
löst. Ebenso werden sie in der visuellen Darstellung durch weitere Dimensionen 
wie Distanz, Gleichzeitigkeit oder Räumlichkeit angereichert - Qualitäten, die 
nicht vorhanden sind, wenn wir die Textdaten selbst betrachten. Die Visualisie- 
rung von Daten ermöglicht es uns, abstrakte Phänomene oder Zusammenhänge 
zu sehen, die sich aus der Betrachtung einzelner Ereignisse oder Datenpunkte 
nicht hätten erschließen lassen.” Sie bietet Möglichkeiten der wissenschaftli- 
chen Exploration. Die digitale Wende hat zahlreiche Diskussionen hervorge- 
bracht über künstliche Intelligenz und die Art und Weise, wie Algorithmen un- 
sere Denkweise verändern oder sogar überflüssig machen könnten. In diesem 
Artikel wird argumentiert, dass die menschlichen Fähigkeiten der Interpretation 
und des „Sinnmachens dessen, was wir sehen“ umso notwendiger sind, wenn 
wir mit computergenerierten Daten und Visualisierungen interagieren.° Nur 
das Zusammenspiel zwischen menschlichen Fähigkeiten der Interpretation und 
der digitalen Mustererkennung produziert Wissen und bietet neue Perspektiven. 
Das vergleichende Betrachten ist das Herzstück dieses Unternehmens. Für die 
Geschichte hat dies einen zentralen Vorteil: Das vergleichende Betrachten von 


51 Noah Bubenhofer, „Visual Linguistics: Plädoyer für ein neues Forschungsfeld,“ in Visuali- 
sierung sprachlicher Daten: Visual Linguistics — Praxis - Tools, hg. v. Noah Bubenhofer und 
Marc Kupietz (Heidelberg: Heidelberg University Publishing, 2018), 54-56. 

52 Heintz und Huber, „Der verführerische Blick,“ 21. 
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Gemeinsamkeiten und Unterschieden in den Daten provoziert neue Erzählun- 
gen des Wandels, die die Notwendigkeit von Chronologien überwinden und die 
Multidimensionalität der Zeit betonen. 

Interaktive Praktiken der Visualisierung erlauben es uns, mit verschiedenen 
Ansichten von Zeit und Geschichte zu spielen, wobei wir uns immer wieder auf 
das beziehen, was wir sehen und was wir wissen. William L. Benzon hat diese 
Praxis als die Aktivierung eines kognitiven Netzwerks beschrieben. Das Lesen 
einer Visualisierung aktiviere verschiedene Teile eines Teilnetzes von Konzep- 
ten und Wissen, die mit den Elementen des Bildes verbunden sind.” Karin 
Knorr Cetina hat einen anderen Weg vorgeschlagen, wie Praktiken der Visuali- 
sierung Praktiken der Repräsentation und Generierung von Information beein- 
flussen. Sie entwickelt die Idee des „Viskurses“ in Analogie zum Diskurs, womit 
die Präsentation von visuellem Material anstelle von verbalen Diskussionen ge- 
meint ist. Die Visualisierungen laufen durch viele Hände; sie werden zur Kennt- 
nis genommen, untersucht und dienen als Anregung für weitere Experimente 
und als Quelle für Imagination in den Naturwissenschaften wie der Physik.™ In 
ihrer Analyse werden „Viskurse“ schnell den Diskursen überlegen, da letztere 
bloßes Gerede seien, während Visualisierungen Ergebnisse zeigten.” Obwohl 
dieses letzte Beispiel wiederum die klassische Verwendung von Visualisierun- 
gen in den Wissenschaften demonstriert, betont es die Analyse von Modellie- 
rungspraktiken als zentral für die Entschlüsselung der Arbeit von Forscher:in- 
nen. In den Geisteswissenschaften spielen Praktiken der Visualisierung und der 
vergleichenden Betrachtung zum Beispiel bei historischen Analysen erst ansatz- 
weise eine Rolle. Aber es ist sicherlich vielversprechend, visuelle, interaktive 
Exploration in unsere Forschungspraktiken zu implementieren. Das gilt nicht 
zuletzt auch, um das eigene Arbeiten besser verstehen zu lernen. Das Bemühen 
um die Modelle macht die eigenen Wissenschaftspraktiken bewusst und ermög- 
licht, die Vorannahmen, Einschränkungen und Chancen der historischen Me- 
thoden sowie unsere Vorstellungen von Geschichte zu reflektieren. 


53 William L. Benzon, „Toward a Computational Historicism: From Literary Networks to the 
Autonomous Aesthetic,“ SSRN Electronic Journal, 2014, doi: 10.2139/ssrn.2432653, 13. 

54 Karin K. Cetina, „‚Viskurse‘ in der Physik: Konsensbildung und visuelle Darstellung,“ in 
Mit dem Auge denken: Strategien der Sichtbarmachung in wissenschaftlichen und virtuellen Wel- 
ten. Theorie - Gestaltung 1, hg. v. Bettina Heintz und Arnold Benz (Zürich: Ed. Voldemeer, 
2001), 308. 

55 Cetina, „‚Viskurse‘ in der Physik,“ 309. 
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Stefan Haas und Christian Wachter 
Visual Heuristics 


Abstract: Research highly depends on third-party funds, raising the importance 
of preliminary results and research prospects in grant applications. At the same 
time, historians increasingly disseminate interim findings or data. This develop- 
ment contrasts an older tradition when historians mainly publicized finished 
works. Therefore, historians face the challenge of thoroughly making the “un- 
finished” plausible more than ever. Our article focuses on heuristics as an early 
stage of research and visualizations as suitable heuristics tools to address this 
challenge. Network graphs, in particular, enable historians (1) to grasp complex 
historical constellations and patterns better and (2) to lay those configurations 
open transparently. This helps historians specifically to grapple with complex 
temporal constellations beyond linear chronology. Unfortunately, the qualities 
of visualizations responsible for this potential still are underexposed. Moreover, 
when utilized, those qualities seldomly are being considered. For this reason, 
our article outlines the heuristic potential of visualizations borrowing from mul- 
timodality research. 


Keywords: visualization, heuristics, visual analytics, temporality, theory 


Zusammenfassung: Im Zeitalter drittmittelabhängiger Wissenschaft gewinnt die 
Formulierung vorläufiger Ergebnisse und Ergebniserwartungen in Forschungs- 
anträgen an Bedeutung. Gleichzeitig steht eine wachsende Kultur der Veröffent- 
lichung von Zwischenergebnissen oder Forschungsdaten einer geschichtswis- 
senschaftlichen Tradition entgegen, der es hauptsächlich um die Präsentation 
von Endergebnissen geht. Diese Entwicklung verlangt nach einer stärkeren 
Plausibilisierung des noch „Unfertigen“. Unser Beitrag nimmt deshalb die For- 
schungsphase der Heuristik in den Fokus und präsentiert Visualisierungen als 
heuristische Mittel zur Plausibilisierung. Besonders Netzwerkgraphen dienen 
als Werkzeuge, um komplexe Zusammenhänge zu erschließen und transparent 
offenzulegen. Dies gilt vor allem für zeitliche Zusammenhänge, die sich einer 
linearen Chronologie entziehen. Die bei solchen Visualisierungen zum Tragen 
kommenden medialen Qualitäten sind bisher jedoch unterreflektiert und wer- 
den eher unbeschwert angewendet. Unser Beitrag will daher anknüpfend an die 
Multimodalitätsforschung das heuristische Potenzial von Visualisierungen 
kennzeichnen. 


3 Open Access. © 2022 Stefan Haas und Christian Wachter, published by De Gruyter. I) Ea Dieses 
Werk ist lizensiert unter einer Creative Commons Namensnennung 4.0 International Lizenz. 
https://doi.org/10.1515/9783110757101-012 
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Im folgenden Text wollen wir für eine stärkere Rationalisierung und Moderni- 
sierung der Heuristik in der Geschichtswissenschaft plädieren. Als Heuristik 
wird jene Phase des wissenschaftlichen Forschungsprozesses angesehen, in 
dem mit verhältnismäßig geringem Arbeitsaufwand ein bereits hoch wahr- 
scheinliches Ergebnis des Vorhabens als Hypothese formuliert wird. Dass diese 
Phase zunehmend an Bedeutung gewinnt, liegt an einigen grundlegenden Ent- 
wicklungen im Wissenschaftssystem, in denen die Drittmittelabhängigkeit nach 
überzeugenden Ergebnisprospektionen verlangt. Doch auch epistemologische 
Entwicklungen spielen eine Rolle, wenn, um frühzeitig Eingang in den For- 
schungsdiskurs zu finden, erste Resultate in Preprints als vorläufige Ergebnisse 
veröffentlicht werden. Im Folgenden stellen wir erste Überlegungen zu diesem 
Komplex vor, die in laufender Forschungsarbeit systematisch ausgearbeitet 
werden sollen. 

Zu Beginn wird darauf einzugehen sein, wie Ergebnisse im Rahmen der 
Heuristik argumentativ legitimiert werden (1). Als Fazit hiervon formulieren 
wir, dass die Geschichtswissenschaft sich verstärkt visuellen Darstellungsfor- 
men ihrer epistemologischen Verfahrensweisen öffnen muss. Diese mediale 
Verschiebung resultiert aus einer sich schleichend, mehr implizit als explizit 
verändernden Epistemologie der historischen Wissenschaften besonders im 
Hinblick auf eine Post-Chronologie und dies führt zu einer Neuordnung der Ar- 
gumentationslogik (2). In einem weiteren Schritt arbeiten wir heraus, wie in 
den Visual Analytics solch komplexe Zusammenhänge bereits mit Visualisie- 
rungen repräsentiert und analysiert werden (3). Damit ist eine Grundlage gege- 
ben, um abschließend in einer theoretischen Argumentation die genauen Rah- 
menanforderungen an eine visuelle Heuristik speziell für die Geschichtswissen- 
schaft in einem ersten Aufschlag zu entwickeln (4). 


1 Warum ist Heuristik zentral für den Wissen- 
schaftsbetrieb im frühen 21. Jahrhundert? 


Unsere Überlegungen gehen davon aus, dass wir in der Anfangsphase unserer 
jeweiligen akademischen Entwicklung, die eine Generation auseinanderliegt, 
die Korrelation von Öffentlichkeit und dem Verfassen einer Promotion unter- 
schiedlich erlebt haben: Der Promotionsgutachter von SH riet ihm nachdrück- 


Visual Heuristics ——= 215 


lich, niemandem vom Gegenstand seiner Doktorarbeit und von seinen Fort- 
schritten zu erzählen. Nicht zumindest, bevor diese fertig ausgearbeitet und ver- 
öffentlicht seien. CW hat während seiner Promotionsphase mehrfach an ver- 
schiedenen Orten seine laufenden Forschungen vorgestellt, er hat wissenschaft- 
liche Kontakte im Kontext des Themas im In- und Ausland bis in die 
Vereinigten Staaten geknüpft. Er konnte dies selbst- und eigenständig tun - 
und wurde von seinem betreuenden Erstgutachter, SH, darin bestärkt und un- 
terstützt. 

Nun könnte man einfach sagen, dass das Wissenschaftssystem sich gewan- 
delt hat. Es gewährt jungen Wissenschaftler:innen mehr Raum für eigene aka- 
demische Aktivitäten. Und ohnehin war nicht überall Anfang der 1990er Jahre 
die Situation für Doktorand:innen und junge Doktor:innen so, wie für SH, der 
eben bei einem besonders altmodischen Vertreter einer klassischen Ordinarien- 
universitätsauffassung als wissenschaftlicher Assistent arbeitete. 

Man kann aber auch, und das ist die klügere Variante, anstatt alles als An- 
sammlung von Fehlern und Vorurteilen einer längst verstorbenen Generation 
anzusehen, nach den wissenschaftskulturell relevanten Veränderungen fragen, 
die sich in der Differenz der beiden Erfahrungen widerspiegeln. Man könnte 
dies so lesen, dass in einem (mittlerweile veralteten) System nur das fertige Er- 
gebnis relevant ist für die Scientific Community insgesamt und für das Fortkom- 
men in der eigenen Karriere. In der aktuellen Verfassung aber hat das System 
Interesse an Arbeitsberichten und am Austausch über Zwischenergebnisse und 
erwartete Resultate. Nach dieser Lesart interessierte sich zumindest im wissen- 
schaftsöffentlichen Raum niemand für „noch nicht ganz Fertiges“. Von Interes- 
se war das „Werk“ und das war eine abgeschlossen erforschte und verfasste 
Einheit. Noch vor der Jahrtausendwende wandelte sich dies grundlegend. 

Eine weitere Beobachtung stützt dies. Um uns Professor:innen an unserer 
Universität dem neuen Präsidium vorzustellen, gab es den Vorschlag, wir soll- 
ten Listen der erfolgreichen Drittmitteleinwerbungen anlegen: Hiernach sollten 
wir uns selbst nicht mehr über Ergebnisse präsentieren, sondern darüber, dass 
man relativ zu Beginn einer Forschungstätigkeit Menschen mit Verfügungs- 
macht über Finanzen hat überzeugen können, Geld für die Durchführung des 
Forschungsvorhabens zu investieren. Die individuelle Forschungsleistung wird 
zunehmend über die erfolgreiche Drittmitteleinwerbung bewertet und For- 
schende werden über dieses Kriterium gerankt. 

Beide Geschichten haben etwas gemeinsam. Im Prozess des Forschens ver- 
liert die Phase der Veröffentlichung von Endergebnissen ihre zentrale Bedeu- 
tung. Die Phase der Formulierung von erwarteten Ergebnissen wird zunehmend 
wichtiger. Diese Phase, in der mit einem geringen eingesetzten Zeitbudget und 
mit begrenztem Wissen aufgrund der meist nur rudimentär erfolgten Quellen- 
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sichtung und Literaturrecherche erwartete Ergebnisse formuliert werden, die 
zumindest als hoch wahrscheinlich angesehen werden können, nennen wir 
Heuristik. Wir meinen damit etwas mehr und anderes als Droysen, der unter 
Heuristik noch im Wesentlichen das Auffinden des passenden Quellenkorpus 
verstand: „Die Heuristik schafft uns die Materialien zur historischen Arbeit her- 
bei; sie ist die Bergmannskunst, zu finden und ans Licht zu holen.“! Dies ge- 
schah noch vor dem Hintergrund, dass man im Historismus glaubte, aus den 
Quellen, wären sie nur kritisch auf ihre Passung zur Vergangenheit geprüft, 
würde die wahre Geschichte „heraussprudeln“, die dann dort durch Interpreta- 
tionen zu ergänzen war, wo Bewertungen vorzunehmen oder Überlieferungslü- 
cken zu füllen waren. Heute sehen wir in Quellen eher Spuren, die nicht nur 
quellenkritisch geprüft, sondern auch mit theoretischem Instrumentarium ana- 
lysiert werden müssen. 

Die gesteigerte Bedeutung der Heuristik im Wissenschaftsbetrieb bedeutet, 
dass hier mehr symbolisches Kapital liegt, als dies früher der Fall war. Dazu 
passt auch die Beobachtung, dass unsere Formate immer kürzer und schneller 
kommunizierbar werden. Wer bloggt, verzichtet in der Regel auf einen aufwen- 
digen Nachweisapparat, da das Blogformat grundsätzlich auf knappe Darlegun- 
gen und Einblicke abzielt. Gleichzeitig soll eine direkt anschließende überregio- 
nale oder gar globale Diskussion angeregt werden. So kann aus der allgemeinen 
Aufwertung heuristischer Prozesse mehr symbolisches Kapital geschlagen wer- 
den. Themen und Forschungsfragen können auf diese Weise auch frühzeitig 
„besetzt“ werden, um im Spiel der Aufmerksamkeitsökonomie wahrgenommen 
zu werden. 

Wenn nun die frühzeitige Einwerbung von Finanzmitteln und damit die An- 
erkennung von Heuristiken zu Forschungsvorhaben zunehmend wichtiger wird 
im Wissenschaftssystem, so bedarf es größerer methodologisch gesicherter 
Nachvollziehbarkeit, sonst verbleiben wir im Kontext klassischer Begriffe wie 
„Erkenntnisinteresse“ und „Deutungshorizont“. Diese Heuristik muss die aktu- 
elle Vorstellung, wie Wissen verfasst sein sollte, widerspiegeln. Hier setzt unse- 
re zweite Voraussetzung an: die (digitale) Visualität als Medium der Heuristik. 


1 Johann Gustav Droysen: Historik: Historisch-kritische Ausgabe Bd. 1, hg. v. Peter Leyh (Stutt- 
gart: Frommann-Holzboog, 1977), 400. 
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2 Was hat eine Heuristik der Zukunft mit post- 
chronologischen Netzwerken zu tun? 


Es mag im ersten Moment seltsam erscheinen, dass angesichts unseres Zieles, 
Geschichte zu schreiben, wir nun das Thema Visualitat aktivieren. Wenn wir Er- 
gebniserwartungen in der Phase der Heuristik auf der Basis begrenzter Informa- 
tionen mit hoher Transparenz und Uberzeugungskraft formulieren wollen, miis- 
sen wir fragen, wie die Geschichte am Ende geschrieben werden soll — was be- 
deutet zu fragen, wie die einzelnen Elemente zusammengebunden werden. Und 
damit ist zu fragen, wie Wissen (im 21. Jahrhundert zeitgemäß) zu organisieren 
ist. Und dass die mediale Organisation von Wissen (mit-)konstitutiv ist für die 
Geschichtswissenschaft, wissen wir nicht nur wegen Hayden Whites narratolo- 
gischen Beitrags zu Handlungsstrukturen in der Geschichtsdarstellung.? 
Um dies zu klären, gehen wir einen Umweg über die klassische, sprich his- 
toristische Heuristik. 
Nach dieser Auffassung des historischen Arbeitsprozesses, wie man sie bei 
Droysen findet’, passiert Folgendes: 
1. Man hat eine historische Frage. 
2. Es werden passende Quellen gesucht. 
3. Diese werden mittels quellenkritischer Methode kritisch daraufhin über- 
prüft, welche Fakten aus ihnen herausgezogen werden können. 
4. Diese Fakten werden in zeitlicher Abfolge, sprich „chrono-logisch“ anein- 
andergereiht. 
5. Das war es dann schon. 


Das klingt nach wenig, aber es war lange Zeit der Kern historiographischen 
Selbstverständnisses, weil die chronologische Reihe einen entscheidenden 
Mehrwert enthält: Jedes Element, das in einer solchen Reihe steht, hat einen di- 
rekten Bezug auf das Vorgehende und das Folgende. Wir Menschen neigen 
dazu, eine solche Reihung als kausale Bedingung oder zumindest als Abfolge 
eines kohärenten Sachverhaltes zu lesen - und wenn wir das nicht können, es 
für dadaistischen Unsinn zu halten. „In Brasilien schlägt ein Schmetterling mit 
den Flügeln. In New York tobt ein Wirbelsturm.“* Das halten wir für Unsinn, bis 


2 Hayden V. White, Metahistory: The Historical Imagination in Nineteenth-Century Europe (Bal- 
timore: Johns Hopkins Univ. Pr., 1973). Allgemein zur Narrativitätsdebatte: Stefan Haas, „Fik- 
tionalität in den Geschichtswissenschaften,“ in Fiktionalität: Ein interdisziplinäres Handbuch, 
hg. v. Tobias Klauk und Tilmann Köppe (Berlin: de Gruyter, 2014), 516-532. 

3 Droysen, Historik, 67 ff. 

4 Edward N. Lorenz, The Essence of Chaos (London: UCL Pr., 1993), 181-184. 
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wir uns chaostheoretisch die Zwischenschritte vorstellen können. Und dann le- 
sen wir es als Kausalitat. 

In der Geschichtswissenschaft tun wir das auch beziehungsweise taten wir 
das im Zeitalter des Historismus. Eine chronologische Reihe von Ereignissen le- 
sen wir als eine (schwach) kausale Entwicklung. Schwach kausal, weil die Geis- 
teswissenschaften des 19. Jahrhunderts immer mit einer gewissen Kontingenz 
gerechnet haben: Es ist folgerichtig, dass es so geschah, aber ein „großer 
Mann“ hätte auch richtungsändernd eingreifen können. Die Reihenfolge der Er- 
eignisse und das chronologische Erzählen sind die meist implizite Kausalerklä- 
rung für das, was in der Vergangenheit geschah. Deswegen ist Quellensammeln 
Heuristik und erlaubt es, eine erste Hypothese zu formulieren, wenn man das 
Material gesammelt, kritisch geprüft und das Ergebnis der Prüfung chronolo- 
gisch in Textform (!) aneinandergereiht hat. 

Es gibt also eine Kongruenz zwischen dem bevorzugten Medium der Ge- 
schichtswissenschaft, dem geschriebenen Text, und der die Geschichtswissen- 
schaft tragenden Vorstellung (zeitlicher) Kausalität - und kulminiert im Begriff 
der Chronologie. Es handelt sich eben um den Logos der Geschichte (doppelter 
Wortsinn) und deswegen wird Geschichtsschreibung und Geschichtswissen- 
schaft so oft synonym eingesetzt. 

Das alles hat natürlich viel mit Hayden Whites erzähltheoretischem Ver- 
ständnis zu tun. Aber über ihn hinausgehend kann man fragen, ob das im 21. 
Jahrhundert so noch ausreicht. Haben wir wirklich das Bild einer Geschichte 
(doppelter Wortsinn) als monolineare Abfolge von Einzelelementen?° 

Der ältere von uns beiden Autoren hat seine Assistentenzeit in der Sozial- 
und Wirtschaftsgeschichte verbracht und dieser Bereich war der erste, der an- 
fing, vergleichend zu verfahren: Wenn man ein Buch schreibt über Industriali- 
sierung in Europa (um es nicht allzu groß werden zu lassen), schreibt man dies 
dann als klar nummerierte Abfolge der Ereignisse entlang einer Zahlenreihe? 
Wohl kaum, denn die Entwicklungen in verschiedenen Ländern können ähnlich 
oder analog ablaufen, aber häufig zeitlich versetzt; in England mit einigen Jahr- 
zehnten Vorlauf zu Ländern wie Belgien und Schweden. Würden wir dann in 
unserem Buch für jedes Land wieder neu nennen, wann die Spinnmaschine 
erstmals auftritt? Zumal sie nicht immer neu erfunden, sondern importiert oder 
gestohlen wird, es also Wechselwirkungen, Transfergewinne oder -verluste 
gibt. Es ist somit nicht nur eine bloße Aneinanderreihung (wie in der klassi- 
schen politischen Ereignisgeschichte), sondern ein komplexes Gewebe von sich 


5 Konzepte von Zeitlichkeit sind bis heute immer wieder für die Geschichtsforschung und 
-schreibung diskutiert worden. Als jüngerer Beitrag hervorzuheben ist Achim Landwehr, Dies- 
seits der Geschichte: Für eine andere Historiographie (Göttingen: Wallstein, 2020). 
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bedingen, sich abgrenzen, neu erfinden oder verbessern, ausspionieren und ko- 
pieren, aber doch auch modifizieren. Manchmal wird etwas vergessen und es 
kommt Generationen später zu einer Neuanknüpfung. Dann wird dies in eine 
neue Zeit geholt, ohne sich langsam durch kontinuierliche Rezeption angepasst 
zu haben. Diese Geschichte ist kein kontinuierlicher Fluss, sondern ein Re-ent- 
ry, das die historische Linie abkürzt, ähnlich wie ein Wurmloch. 

Für eine Wirtschaftsgeschichte der Industrialisierung — wie für viele andere 
Geschichten - ist nicht die Linie die passende Erzählstruktur, sondern das Netz- 
werk oder Multilinearität ein Geflecht von Bedingungen, Abhängigkeiten und 
Bezügen. Eine solche Netzwerkgeschichte ist nicht als klassischer Text realisier- 
bar, sondern als Bild: weil das Bild es erlaubt, genau diese Hyperstruktur zu 
realisieren. Wer heute Forschung vorstrukturieren möchte, muss dies, um es 
zeitgemäß zu tun, in einem Medium formulieren, das Netzwerkstrukturen dar- 
stellen kann: Und das sind nicht jene, die diachron funktionieren, sondern die, 
die Synchronität darstellen können.° Und deswegen arbeiten wir an einer visu- 
ellen Heuristik. Wir schließen damit an Visualisierungspraktiken an, die sich in 
den Digital Humanities (DH) bis heute ausdifferenziert entwickelt haben. Dies 
soll im nächsten Schritt deutlich werden. 


3 Heuristische Verfahren der Visual Analytics als 
Innovationstreiber 


In den DH spielen Visualisierungen eine große Rolle, um komplexe Zusammen- 
hänge - wie etwa zeitliche Beziehungen in Forschungsdaten - zu beforschen. 
Sie fungieren nicht als reine Illustrationen, sondern als Verfahrensmittel: Sie er- 
möglichen es, informative Muster in Datensätzen zu erkennen, um sodann wei- 
tergehende Analysen anzustellen. Unter dem Label „Visual Analytics“ haben 
wir es mit einem Forschungsfeld zu tun, dessen Diskurs derzeit auf mehreren 
Ebenen stattfindet: 

1. Mikroebene: Forschungsprojekte demonstrieren und besprechen den Ein- 

satz ihrer Visualisierungen als Analysehilfsmittel. 


6 Unsere Überlegungen speisen sich aus verschiedenen bild- und medien- sowie technikwis- 
senschaftlichen Ansätzen, siehe: Stefan Haas, „Vom Schreiben in Bildern: Visualität, Narrati- 
vität und digitale Medien in den historischen Wissenschaften,“ Zeitenblicke: Digitale Medien 
und Wissenschaftskulturen 5/3 (2006). Zugriff am 17.05.2022, http://www.zeitenblicke.de/2006/ 
3/Haas/index_html. 
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2. Mesoebene: Visualisierungsverfahren beziehungsweise -tools werden zum 
Gegenstand der Diskussion. 

3. Metaebene: Die wissenschaftstheoretische Auseinandersetzung nimmt sich 
visueller (meist gleichzeitig interaktiver) Datenrepräsentation als Phäno- 
men an. Im Fokus steht die Frage, wie und weshalb Visualisierungen das 
Methodenspektrum der DH bereichern. 


Für den heuristischen Kontext ist besonders der dritte Bereich, die Methodenre- 
flexion und -kritik auf der Metaebene relevant. Visualisierungen ermöglichen 
anders als Listen, Tabellen oder weitere, eher lineare Darstellungsweisen einen 
synchronen Überblick über Datenrepräsentationen und regen auf diese Weise 
zu einem vertiefenden Zugriff auf erkennbare Strukturen und Muster an. Dieser 
analytische Mehrwert hat dazu geführt, dass Visualisierungen zum Teil unter 
den Schlagworten „Logik des Bildlichen“ und „ikonischer Vernunft“ diskutiert 
werden. Gemeint sind dabei einerseits diagrammatische Formen abstrakter Da- 
tenrepräsentationen,® etwa als Netzwerkgraphen. Andererseits sind Repräsenta- 
tionen ganzer Forschungsobjekte angesprochen, beispielsweise, wenn viele 
Bilddigitalisate in einem zweidimensionalen Koordinatensystem nach ihrer 
Farbgebung angeordnet werden, um hier Ähnlichkeiten und Unterschiede zwi- 
schen allen Bildern nachvollziehen zu können, dabei gleichzeitig die Bilder als 
solche präsent zu halten. Beispiele dieser Art hat Lev Manovich als „media vi- 
sualization“? besprochen. Im Gegensatz zu nüchternen, vermeintlich „objekti- 
ven“ Datenrepräsentationen hat vor allem Johanna Drucker für die Geisteswis- 
senschaften solche eingefordert, welche die Gemachtheit der Visualisierung 
und die dabei zum Tragen kommende Perspektivität der Forschenden in den 
Vordergrund rücken. Derartige „humanistic visualizations“? markieren etwa 
Bereiche in den Visualisierungen, für die zwar keine Daten vorliegen, für die 
die Existenz von Daten aber begründeterweise angenommen werden kann. Man 
denke nur an historische Quellen, die uns aufgrund von Archivschäden heute 
nicht mehr zur Verfügung stehen, von deren früherer Existenz wir aber gesi- 
chert wissen. Aus heuristischer Perspektive ist eine grobe Abbildung derartig 
blinder Flecken gemeinsam mit den empirisch erhobenen Daten besonders viel- 


7 Martina Heßler und Dieter Mersch (Hg.), Logik des Bildlichen: Zur Kritik der ikonischen Ver- 
nunft (Bielefeld: transcript, 2009). 

8 Sybille Krämer und Christina Ljungberg (Hg.), Thinking with Diagrams: The Semiotic Basis of 
Human Cognition (Boston: de Gruyter Mouton, 2016). 

9 Lev Manovich, Cultural Analytics (Cambridge, MA: The MIT Press, 2020), 203-206, 223-244. 
10 Johanna Drucker, Graphesis: Visual Forms of Knowledge Production (Cambridge, MA: Har- 
vard Univ. Pr., 2014), 135-192. 


Visual Heuristics —— 221 


versprechend. Schließlich können damit sowohl erste Beobachtungen und For- 
schungshypothesen angestellt werden, als auch transparent gemacht werden, 
auf welcher Grundlage diese heuristischen Schritte erfolgen und wie umgrenzt 
diese Grundlage ist. 

Diese Auflistung heuristischer Praktiken in den Visual Analytics ist selbst- 
verständlich nicht erschöpfend. Das bisher Dargestellte verdeutlicht jedoch be- 
reits, wie Visualisierungen als „tools of scholarly inquiry and narrative“!! wir- 
ken können, wie es David J. Staley fasst. 

Wir folgen seinem Grundverständnis, wenn wir Visualisierungen als räum- 
liche Organisation bedeutungstragender Informationen verstehen, um systema- 
tische Untersuchungen voranzutreiben.” Dabei liefert Staley neben wenigen an- 
deren Beiträgen zum Einsatz visueller Medien in der historischen Forschung 
erste Ansatze. Eine tiefer gehende theoretisch-methodologische Fundierung 
heuristischer Einsatzmöglichkeiten für Visualisierungen fehlt allerdings bislang 
für unsere Disziplin. Zwar führen zahlreiche Forschungsprojekte Analysen mit- 
hilfe von Visualisierungen durch und deren instrumenteller Wert wird zumeist 
durchaus anerkannt. Allerdings erfolgt der Gebrauch größtenteils eher „unbe- 
schwert“. Eine reflektierte Auseinandersetzung unter fachspezifischer Ein- 
schärfung erscheint vor allem deswegen wesentlich, weil die instrumentelle 
Funktion von Visualisierungen als Analysehilfsmittel nur dann gezielt ausge- 
spielt werden kann, wenn sie den geschichtswissenschaftlichen Erkenntnisin- 
teressen gerecht werden. So manche, aber nicht jede Visualisierungsmethode 
ist für die Geschichtsforschung im gleichen Maße instruktiv wie für andere digi- 
tale Geisteswissenschaften. 

Welche Gestaltungskriterien müssen Visualisierungen also erfüllen, um die 
beschriebenen heuristischen Effekte theoretisch untermauert und reflektiert im 
Forschungsalltag anwenden zu können? 

Gerade die letzte Frage richtet sich gegen die erwähnte „unbeschwerte“ 
Verwendung von Visualisierungen, indem es zunächst um die medialen Eigen- 
schaften und Potenziale visueller Repräsentation geht, woraus neue Fragen er- 
wachsen: Was bedeutet die synchrone Abbildung bedeutungstragender Ele- 


11 So David J. Staley, Computers, Visualization, and History: How New Technology Will Trans- 
form our Understanding of the Past (Armonk: Sharpe, 2014), xiii. 

12 Staley, Computers, 36. 

13 Haas, Schreiben in Bildern. 

14 So hat es Noah Bubenhofer analog fiir den Gebrauch von Visualisierungen in der Linguistik 
formuliert. Noah Bubenhofer, „Visual Linguistics: Plädoyer fiir ein neues Forschungsfeld,“ in 
Visualisierung sprachlicher Daten: Visual Linguistics — Praxis — Tools, hg. v. Noah Bubenhofer 
und Marc Kupietz (Heidelberg: Heidelberg Univ. Publ., 2018), 25-26. 
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mente (zum Beispiel Knoten und Kanten in einem Netzwerk) fiir die Wahrneh- 
mung von Betrachter:innen? Wie funktioniert eine „Grammatik des Bildli- 
chen“, die anderen Regeln folgt als schriftsprachliche Grammatik? Hier wird 
in einem ersten Schritt nach dem Möglichkeitsraum gefragt, den das Visualisie- 
ren medial anbietet. Im zweiten Schritt knüpft die Frage an, wie man sich dieser 
Möglichkeiten für ein Forschungsinteresse gezielt bedienen kann. Mit anderen 
Worten liefert eine medientheoretische Fundierung ein klareres Bild von Visua- 
lisierungspotenzialen, womit reflektiertere heuristische Verwendungsweisen 
möglich werden. 

Im Folgenden soll ein erstes Angebot in diese Richtung gemacht werden. 
Dabei werden allen voran Visualisierungen von Netzwerken als vielverspre- 
chend für die Visual Heuristics in der Geschichtswissenschaft vorgestellt. 


4 Netzwerkgraphen als heuristische Werkzeuge 
der Geschichtswissenschaft 


Wenn Visualisierungen Muster im Datenbestand erkennen lassen, dann stehen 
diese für Korrelationen zwischen Objekten. Diese visuell repräsentierten Korre- 
lationen lassen sich in einzelne Aussagen übersetzen und damit sprachlich ana- 
lytisch wiedergeben. Mit diesem Verständnis gehen wir also von keiner scharfen 
Trennung zwischen bildlicher und sprachlicher Modalität aus. Vielmehr folgen 
wir einem multimodalen Ansatz, der bildlinguistisch informiert ist. Hiernach 
sind bildliche Darstellungen als Propositionskomplexe aufzufassen.'® 

Solch ein Netzwerk an Aussagen wird durch vorausgegangene Datenerhe- 
bungen gewonnen, ehe es visuell repräsentiert wird. Dabei hängen die ange- 
wandten Erhebungsparameter stets von menschlichen Entscheidungen ab; die 
Propositionskomplexe erwachsen also einer Perspektivität und implizieren Kon- 
zepte, die in sie eingeschrieben worden sind. Gleiches gilt für die Entscheidung, 
in welcher genauen Form sie visuell repräsentiert werden sollen, beziehungs- 
weise wie die Visualisierung modelliert werden soll." 


15 Gunther Kress und Theo van Leeuwen, Reading Images: The Grammar of Visual Design 
(London: Routledge, 2021). 

16 Vgl. Franziska Große, Bild-Linguistik: Grundbegriffe und Methoden der linguistischen Bild- 
analyse in Text- und Diskursumgebungen (Frankfurt a. M.: Lang, 2011), 118-22. 

17 Vgl. Drucker, Graphesis. 

18 Zur Modellierung von Daten und Visualisierungen siehe: Zoe Schubert, Jan Wieners und 
Øyvind Eide, „Visuelle modellbasierte Experimente in den (digitalen) Geisteswissenschaften, “ 
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Wenn man nun die durch die Visualisierung repräsentierten einzelnen Aus- 
sagen zusammen- beziehungsweise in Beziehungen zueinander setzt, können 
narrative Strukturen aufgespürt werden: Nehmen wir etwa an, Objekt A ist im- 
mer dann zu beobachten, wenn die Objekte B und C auftreten, ansonsten nicht. 
Stehen diese Objekte für bestimmte Ereignisse, können wir nicht nur ein zeitli- 
ches Nacheinander ablesen, sondern hierbei ein Bedingungsverhältnis vermu- 
ten und überprüfen, wie in den vorausgegangenen Abschnitten bereits ange- 
sprochen. Dies gilt auch für weitere Konstellationen im Datenbestand, wie Häu- 
fungen, Asymmetrien, komplett isolierte Objekte oder Ähnliches. Etwas 
verkürzend ausgedrückt repräsentiert die Visualisierung in solchen Fällen „im- 
plizite Erzählungen“. Allerdings sind sie aufgrund der bildlichen Modalität 
„nur vage und unterdeterminiert“!? wiedergegeben; der genaue Inhalt der Zu- 
sammenhänge ist nicht sogleich erkennbar. Er muss analytisch herausgelesen 
werden und dieses Herauslesen kann als eine heuristische Praxis verstanden 
werden. 

Netzwerkgraphen korrespondieren nun besonders deutlich mit diesem Phä- 
nomen, weil die einzelnen Objekte als Knoten individuell repräsentiert werden 
und die Kanten die semantischen Verbindungen zwischen ihnen strukturell ein- 
deutig wiedergeben. Man kann hier von einer ikonischen Abbildung dieser pro- 
positionalen Strukturen sprechen.” Aus einer heuristischen Sicht ist dies be- 
sonders wertvoll, geht es für die Formulierung von Forschungshypothesen 
doch um das Erkennen bedeutungsvoller Zusammenhänge, die es im Anschluss 
sprachlich wohlformuliert auszubuchstabieren gilt. Wenn man es auf eine ver- 
kürzte Formel bringen will, dann spiegelt ein Netzwerkgraph die Kohärenz- 
struktur inhaltlicher Bezüge in besonders direkter Weise wider. 

Dieses Verständnis steht im Einklang mit Gunther Kress’ und Theo van Lee- 
uwens Konzept der „analytical structures“, die beide Pioniere der Multimodali- 
tätsforschung in ihrem Standardwerk „Reading Images“ erläutern: „Analytical 
structures“ sind visuell repräsentierte Strukturen, in denen Bildelemente in Be- 


in Fabrikation von Erkenntnis — Experimente in den Digital Humanities, hg. v. Manuel Burghardt 
et al. (Luxembourg: Melusina Press, 2021-2022. doi: 10.17175/sb005_007. 

19 Hartmut Stöckl, „Sprache-Bild-Texte lesen: Bausteine zur Methodik einer Grundkompe- 
tenz,“ in Bildlinguistik: Theorien - Methoden - Fallbeispiele, hg. v. Hans-Joachim Diekmanns- 
henke, Michael Klemm und Hartmut Stöckl (Berlin: Erich Schmidt Verlag, 2011), 45-70. 

20 Vgl. Linda Freyberg, „Iconicity as Simultaneous Plurality - Beyond the Restraints of Formal 
Knowledge Organization Systems,“ in Charles S. Peirce: Bridging the Disciplinary Boundaries of 
Natural Sciences and Humanities, hg. v. Elize Bisanz (Berlin: Peter Lang, 2019), 123-150 sowie 
Dies. Ikonizität der Information: Die Erkenntnisfunktion struktureller und gestalteter Bildlichkeit 
in der digitalen Wissensorganisation (Berlin: Humboldt Universitat zu Berlin, 2021). 
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ziehungen zu etwas Größerem dargestellt werden („meronymical relations“).”! 
Kress und van Leeuwen sehen in einem visualisierten Netzwerk konkreter eine 
„connected analytical structure“. Die Beziehungen von Elementen zum „gro- 
ßen Ganzen“ und die Verbindung der Elemente untereinander sind hier also 
das Wesentliche. 

Wertet man einen Netzwerkgraphen heuristisch aus, haben die Ergebnisse 
zwar immer nur einen ersten Annäherungswert; allerdings können auf dieser 
Basis deutlich transparenter und damit rationaler als mit klassischen herme- 
neutischen Daten- und Quelleninterpretationen oder impliziten Vergleichsver- 
fahren Forschungshypothesen generiert werden. Schließlich wird durch die 
überblicksartige und interaktiv ansteuerbare Visualisierung nicht nur das Er- 
kennen interessanter Zusammenhänge erleichtert. Auch der Verweis auf diese 
Zusammenhänge wird nachvollziehbarer. Bei Forschungsfragen mit umfangrei- 
chem Datenmaterial werden Forschungshypothesen und transparente Offenle- 
gung überhaupt erst mithilfe solcher Visualisierungen möglich. Als ein passen- 
des Format bieten sich hier etwa Data Stories an, in denen Daten vorgestellt, 
kommentiert, erste Interpretationen angeboten und Visualisierungen eingebun- 
den werden können.” 

Innerhalb der visualisierten impliziten Erzählungen interessieren Histori- 
ker:innen je nach Forschungsfrage verschiedene Zusammenhänge, die nicht für 
alle weiteren Geisteswissenschaften gleichermaßen von Bedeutung sind. Hier 
wären beispielsweise Netzwerke von historischen Akteur:innen, Diskursen, po- 
litischen Entscheidungen und anderen Untersuchungsobjekten zu nennen. 
Auch Argumentationsstrukturen in beforschten historischen Diskursen werden 
interessant, in denen Einzelaussagen zueinander in (kausale, kontingente, be- 
griindende, negierende usw.) Beziehungen gesetzt werden. Kommen wir auf die 
postchronologischen komplexen Zeitrelationen zurück, wirkt das heuristische 
Potenzial von Netzwerkgraphen besonders vielversprechend: Transferleistun- 
gen in transnationalen Bezügen, Wechselwirkungen unterschiedlicher Wirk- 
lichkeitssegmente wie Gesellschaft, Politik, Kultur, Technik usw. Sie können 
derart komplex ausfallen, dass für ihre Untersuchung monolineare Abläufe 
kaum tragen. Netzwerkartige Visualisierungen stehen dem mit ihrer Fähigkeit, 


21 Kress und van Leeuwen, Reading Images, 76. 

22 Ibid., 91. 

23 Siehe etwa Anna Feigenbaum und Aria Alamalhodaei, The Data Storytelling Workbook 
(London, New York: Routledge, 2020). Ein Beispiel kann gegeben werden mit der Data Story 
von Fabio Fromme et al., Sammeln, Beschreiben, Kategorisieren - Vom Umgang mit menschli- 
chen Überresten zu Beginn der modernen Wissenschaft (Bielefeld: SFB 1288, Practices of Com- 
paring, 2020). 
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räumlich komplexer und überblicksartig abbilden zu können, entgegen. Dies 
gilt allein schon durch die Abbildbarkeit von gleichzeitigen, eben nicht sukzes- 
siven Wechselwirkungen, komplexen Abhängigkeiten bis zum Re-entry. 


5 Resümee: Visuelle Heuristik für die Geschichts- 
wissenschaft im 21. Jahrhundert 


Im heutigen Wissenschaftsbetrieb ist eine gewachsene Bedeutung für die Kom- 
munikation vorläufiger Forschungsergebnisse und der Prospektion erwartbarer 
Resultate zu beobachten. Im Vergleich zu vergangenen Jahrzehnten bleibt die 
Publikation endgültiger Forschungsergebnisse zwar wesentlich für die Teilnah- 
me am Wissenschaftsdiskurs, doch der Präsentation von „nicht Fertigem“ 
kommt ein gesteigertes Gewicht zu. Dafür lassen sich verschiedene Gründe an- 
geben, die in vielen Fällen mit der Generierung symbolischen Kapitals durch 
Forschende zusammenhängen: (1) Forschung beruht mehr denn je auf der Dritt- 
mittelfinanzierung. Vor diesem Hintergrund ist es zu einem maßgebenden Leis- 
tungskriterium geworden, Gutachter:innen von Forschungsvorhaben und -zie- 
len zu überzeugen. (2) Erfolg für die eigene Karriere bemisst sich auch darin, 
wie schnell Themen und Ansätze mit ersten Positionierungen „besetzt“ werden. 
Schnelle Publikationsformen und der zeitige Austausch mit der Wissenschafts- 
community werden dafür bemüht. (3) Neben die Finanzierungs- und Karriereas- 
pekte treten methodische und epistemische Gesichtspunkte. In zunehmend in- 
terdisziplinären Vorhaben (nicht nur) digitaler Forschung, wird der Austausch 
über Zwischenergebnisse, Methoden und Daten bedeutsam, um aus unter- 
schiedlichen methodischen und disziplinären Richtungen Rückmeldungen zu 
erhalten sowie an den interdisziplinären Forschungsdiskurs anzuschließen. 

Allen drei vorgenannten Punkten liegt die Forschungsphase der Heuristik 
zugrunde. In breiter wissenschaftstheoretischer Definition handelt es sich dabei 
um die Formulierung erwarteter beziehungsweise als hoch wahrscheinlich an- 
gesehener Resultate, nachdem mit beschränktem Zeitbudget und begrenztem 
Vorwissen eine erste unvollständige Quellen- und Literatursichtung erfolgt ist. 
Wenn der Forschungsphase der Heuristik heute aber eine gesteigerte Bedeu- 
tung zukommt, dann stellt sich die Frage, wie heuristische Aussagen rational 
abgesichert werden können. Wie kann das oftmals bemühte „erwartbare Ergeb- 
nis“ derart fundiert und plausibilisiert werden, dass wir über allzu allgemeine 
Bemerkungen über „Erkenntnisinteresse“ und „Deutungshorizont“ hinauskom- 
men? 
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Für ein Antwortangebot haben wir uns auf zeitliche Zusammenhänge kon- 
zentriert, auf die sich die Geschichtswissenschaft zentral richtet und die sich 
nach klassischem heuristischen Verständnis vor allem in chronologischen Ab- 
folgen erschöpfen. Diese suggerieren kausale Prozesse oder zumindest klar ko- 
härente Entwicklungsschritte innerhalb historischer Entwicklungen. Inzwi- 
schen fragen Historiker:innen allerdings zunehmend nach der Gleichzeitigkeit 
von Prozessen, nach Transfer, Verflechtung oder Re-entry - nach Zusammen- 
hängen, die nicht dem Ordnungsprinzip linear-chronologischer Abfolgen gehor- 
chen und sich der Logik kausaler Ketten entziehen. Non-Linearität erweist sich 
als angemesseneres Denkmuster. Visualisierte Netzwerke dienen sich dann als 
heuristische Werkzeuge an, da mit ihnen postchronologische, netzwerkartige 
Zusammenhänge synchron und hiermit besonders eindeutig wiedergegeben 
werden können. So spielen Netzwerkgraphen neben anderen Visualisierungs- 
formen in den Visual Analytics auch seit Längerem eine bedeutende Rolle, um 
Resultate komplexer Datenanalysen mithilfe eines interaktiven und bildlichen 
Interfaces auszuwerten. Der heuristische Zugriff kann hiermit besonders frucht- 
bar gelingen, weil die Komplexität der strukturell repräsentierten Zusammen- 
hänge erhalten bleibt, dabei aber Überblick und Orientierung für die Identifika- 
tion interessanter Korrelationen und Muster gestiftet werden. Solche Muster 
können erkenntnisfördernde Beobachtungen hervorbringen, die in die spätere 
historiografische Erzählung eingehen. Hier kann, metaphorisch, von „implizi- 
ten“ Erzählungen innerhalb der Visualisierung gesprochen werden, die es „her- 
auszulesen“ und zu explizieren gilt. 

Während ein solches Vorgehen in den Visual Analytics an der Tagesord- 
nung ist, erfolgt sie oftmals eher „unbeschwert“, ohne tiefergehende Reflexion 
der semiotischen Eigenschaften von Visualisierungen. Wir haben aus diesem 
Grund an interdisziplinäre Beiträge zur Multimodalitätsforschung angeschlos- 
sen, um herauszustellen, aus welchen medialen Qualitäten heraus visualisierte 
Netzwerke als analytische Werkzeuge fungieren können: Die bildliche Qualität 
von Netzwerkgraphen zeigt sich im Wesentlichen in der ikonischen Repräsenta- 
tion von Zusammenhängen, genauer gesagt in der direkten Abbildung von Ko- 
härenzstrukturen. Eine solche strukturelle Übersicht sagt zwar noch wenig über 
die semantischen Gehalte der Zusammenhänge aus, aber sie regt zu einer ge- 
naueren Ergründung ebendieser an. Die bildliche Darstellung symbolisiert ei- 
nen Komplex an Aussagen (Propositionskomplex), welche die einzelnen Zusam- 
menhänge sprachlich ausbuchstabieren. Eine derartige theoretische Fundie- 
rung hat den Vorteil, dass sie den Rahmen an Gestaltungsmöglichkeiten 
medientheoretisch absteckt, damit hiernach Forschungsvorhaben sich dessen 
bedienen können, um ebenjene Visualisierungsdesigns zu entwickeln, die zum 
Forschungsdesign passen. Im Fall von Geschichtsforschung, die den epistemi- 
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schen Anspruch auf Ergriindung postchronologischer und weiterer non-linearer 
Zusammenhänge erhebt, identifizieren wir Netzwerkgraphen als einen solch 
passenden Visualisierungstyp. 

Im Rahmen der geschichtswissenschaftlichen Heuristik bieten sich Netz- 
werkgraphen jedoch nicht allein zur Analyse an. Historiker:innen können auch 
ihre (Hypo-)Thesen, vorläufigen Resultate und Ergebnisprospektionen stärker 
rationalisieren, wenn sie bei ihren Explikationen auf entsprechende Teile der 
visualisierten Zusammenhänge verweisen. Die derart angesprochenen Konstel- 
lationen und Muster bleiben dabei im Gesamtzusammenhang des ganzen Netz- 
werkes sichtbar. Endgültige Forschungsergebnisse mögen in ihrer historiografi- 
schen Form zwar weiterhin nicht netzwerkartig aufgebaut sein, sondern höchs- 
tens multilinear - auch komplexe Wissensangebote verfügen über eine zwar 
verwobene, aber wohlstrukturierte argumentative und narrative Form.” Doch 
im Stadium der Heuristik erleichtern visualisierte Netzwerke erstens die Hypo- 
thesenbildung und stellen sie zweitens transparenter dar, als dies derzeit zu- 
meist der Fall ist. 
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Materialitat und Praxis 


Zur Analyse historischer Datenverarbeitung am Beispiel des 
Vietnamkrieges 


Abstract: Genuinely digital archival materials require a new set of analytical 
and critical approaches. They display seemingly paradoxical characteristics, 
some of which they share with conventional sources, but some of which differ 
significantly from them. In addition to their content, born-digital sources have 
certain formal properties and are characterized by the materiality of the respec- 
tive processing and storage media. Using the example of a database system 
from the Vietnam War, the article discusses the specific requirements but also 
the potentials of an analysis of historical data processing and original digital 
sources, taking into account their material properties and the socio-technical 
practice of their collection, processing and storage. 


Keywords: databases, born digital sources, hermeneutics, source criticism, Viet- 
nam War computer history, archiving 


Zusammenfassung: Originär digitale Quellen erfordern ein neues Instrumenta- 
rium der Quellenkritik und Analyse. Sie weisen scheinbar paradoxe Eigenschaf- 
ten auf, die sie zum Teil mit herkömmlichen Quellen teilen, die sich von diesen 
zum Teil aber auch deutlich unterscheiden. Neben ihrem inhaltlichen Gehalt 
haben sie bestimmte formale Eigenschaften und sind von der Materialität der 
jeweiligen Verarbeitungs- und Speichermedien gekennzeichnet. Am Beispiel ei- 
nes Datenbanksystems aus dem Vietnamkrieg diskutiert der Beitrag die spezifi- 
schen Anforderungen aber auch Potentiale einer Analyse historischer Datenver- 
arbeitung und originär digitaler Quellen unter Berücksichtigung ihrer materiel- 
len Eigenschaften und der sozio-technischen Praxis ihrer Erhebung, 
Verarbeitung und Speicherung. 


Schlagwörter: Datenbanken, Born-digital Quellen, Hermeneutik, Quellenkritik, 
Vietnamkrieg, Computer-Geschichte, Archivierung 
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Im Jahr 2011 formulierte der Zeithistoriker Kiran Klaus Patel die Frage ,,wer ar- 
chiviert eigentlich die SMS von Angela Merkel?“! Obwohl diese Frage bereits 
zwei Jahre später überraschend von Edward Snowden beantwortet wurde, blei- 
ben Patels Appelle an die Geschichtswissenschaften aktuell: Patel verweist auf 
die Relevanz digitaler Kommunikation zum Verständnis und der Erforschung 
der jüngsten Vergangenheit, auf die Dringlichkeit, dieser Relevanz in der archi- 
valischen Sammlungs- und Bewahrungspraxis zu entsprechen und appelliert 
schließlich (implizit) an die eigene Zunft, sich auf die methodischen Herausfor- 
derungen im Umgang mit einer scheinbar neuen Quellengattung einzulassen. 
Heute, zehn Jahre später, ist die Digital History aus den Diskussionen des 
Faches nicht mehr wegzudenken. Auffällig ist jedoch, dass Arbeiten zur Zeitge- 
schichte und speziell solche, die dezidiert originär digitale Quellen untersu- 
chen, nach wie vor eher rar sind. Dies ist keinesfalls nur einem methodischen 
Konservativismus der Disziplin geschuldet, sondern hat auch mit dem Charak- 
ter digitaler Quellen zu tun. Ihre Erforschung stellt die Geschichtswissenschaft 
vor erhebliche und bislang ungelöste methodische und analytische Probleme, 
die im Folgenden anhand von drei Paradoxien vorgestellt werden. Dem schließt 
sich eine kurze Skizze vielversprechender theoretisch-konzeptioneller Zugänge 
zu originär digitalen Quellen (digital born) an, deren Potential daraufhin am 
Beispiel eines Datenbanksystems aus dem Vietnamkrieg illustriert wird. 


1 Drei Paradoxien originär digitaler Quellen: 
Überfluss und Mangel, Stabilität und Volatilität, 
Virtualität und Materialität 


Der Digital History mangelt es nicht an Manifesten und euphorischen Program- 
matiken, in denen ihre Innovationskraft und die durch sie ermöglichte Erweite- 
rung der Perspektiven und breitere empirische Fundierung geschichtswissen- 
schaftlicher Forschung beschworen wird.” Zudem sind solche Texte von der Ge- 
wissheit getragen, dass die Grundtendenz zur fortschreitenden Digitalisierung 
auch zu einer quantitativen Steigerung von digitalen Quellen führen wird. An- 


1 Kiran Klaus Patel, „Zeitgeschichte im digitalen Zeitalter. Neue und alte Herausforderungen, “ 
Vierteljahreshefte für Zeitgeschichte 59/3 (2011): 331-351. 

2 Jo Guldi und David Armitage, The History Manifesto (Cambridge, UK: Cambridge University 
Press, 2014); Shawn Graham, Ian Milligan und Scott Weingart, Exploring Big Historical Data: 
The Historian’s Macroscope (London: Imperial College Press, 2016). 
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gesichts der seit der Jahrtausendwende laufenden großen Projekte der Retrodi- 
gitalisierung durch Archive und Bibliotheken sowie des erleichterten Online-Zu- 
gangs zu diesen Beständen entspricht die oft formulierte Wahrnehmung eines 
Überflusses an möglichen Quellen durchaus der Alltagserfahrung praktizieren- 
der Historiker:innen.? 

In krassem Gegensatz steht diese Gewissheit zu Warnungen vor einem in- 
formationellen „schwarzen Loch“ digitaler Amnesie, ja, einem digitalen „dunk- 
len Zeitalter“, wie sie seit der Jahrhundertwende vermehrt zu vernehmen sind.* 
Die Archivwissenschaft befasst sich bereits seit den 1990er Jahren intensiv mit 
dieser Problematik, wohl aus der praktischen Erfahrung, dass damals digitale 
Dokumente meist ausgedruckt an Archive übergeben wurden (und damit als in- 
terpoliert und selektiv gelten konnten), oder dass Archive digitale Quellen und 
Artefakte stetig in neue Formate überführen mussten, was ebenfalls einer Inter- 
polation gleichkommen konnte.” Außerdem gewann in der Langzeitbewahrung 
auch die Selektion der zu bewahrenden Zeugnisse angesichts einer steigenden 
Menge von digitalen Aktivitäten und Hinterlassenschaften an Bedeutung.® 

Archiv-, Bibliotheks- und Geschichtswissenschaften versuchen dieser Pro- 
blemlage durch die gemeinsame Entwicklung von Standards zur Bewahrung 
von und des Zugangs zu originär digitalen Quellen zu begegnen.’ Letztlich aber 
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verweisen solche Anstrengungen auf die enormen und dieser Quellenform inha- 
renten Anforderungen: das exponentielle quantitative Wachstum möglicher 
Quellen; der damit einhergehende Mehraufwand in der Anreicherung und Be- 
schreibung der Bestände mit entsprechenden Metadaten; und nicht zuletzt die 
technischen, personellen und auch energetischen Schwierigkeiten, der Obsoles- 
zenz historischer Systeme und Medien langfristig und nachhaltig zu begegnen.® 
Originär digitale Quellen sind also von der paradoxen Situation gekennzeich- 
net, dass gleichzeitig ein Überfluss und ein Mangel zu herrschen scheint. 

Ein zweites Paradox, das digital born Quellen inhärent ist, betrifft ihre 
gleichzeitige Flüchtigkeit (oder Volatilität) und Stabilität. Im Zusammenhang 
mit der bereits angeschnittenen Obsoleszenz und der andauernden Suche nach 
Strategien zur Langzeitarchivierung beschreibt etwa Paul Dourish dieses para- 
doxe Verhältnis: 


On one hand, digitization and digital information are often associated with preservation 
and archival practices; think, for example, of efforts to digitize ancient manuscripts to 
make them available even as material on which they are written crumbles, or, on a more 
mundane level, of the services that promise to “preserve” your family members by digitiz- 
ing old photographs, film, and videotape. Yet the digital devices on which these digital 
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materials are dependent are not themselves eternal or even particularly long-lived. Com- 
puter-systems from even just a few years ago are already obsolete and aging.” 


Diese Paradoxie setzte sich von den Medien und Formaten fort hin zu den Datei- 
en und Daten selbst, wie wir von unserem täglichen Umgang mit Schreibpro- 
grammen und Emails wissen: Unsere Texte und Korrespondenzen existieren in 
mehreren Stadien, vom Entwurf bis zur ersten publikationsfahigen Version 
durchlaufen sie mehrfache Durchgänge der Veränderung. Auch Websites, Chat- 
verläufe und natürlich allen voran Datenbanken sind einer stetigen Erneuerung 
und Aktualisierung unterworfen, eine Eigenschaft, die der Etymologie des Be- 
griffs „Datum“ als etwas Gegebenes, Festes, zuwiderläuft.!° Damit haben Daten- 
banken und die in ihnen enthaltenen Informationen einen inhärent provisori- 
schen und volatilen Charakter, der sowohl ihre Archivierung als auch ihre ge- 
schichtswissenschaftliche Analyse stets mit der Frage konfrontiert, ob es sich 
bei einer Quelle um einen „Schnappschuss“ oder um den „letzten Stand“ han- 
delt, und was dies jeweils für ihre Interpretation bedeutet. Mehr noch: viele di- 
gital born Quellen sind nicht nur dynamisch, sondern auch interaktiv. Vor al- 
lem bei Datenbanken, aber auch bei anderen originär digitalen Artefakten ist zu 
konstatieren, dass einzelne Datensätze und Datenpunkte überhaupt erst durch 
Interaktion — etwa durch Abfrage - entstehen." 

Im Widerspruch zur Flüchtigkeit originär digitaler Quellen steht ihre bemer- 
kenswerte Stabilität, die sich der einfachen Kopierbarkeit und damit potentiel- 
len Loslösung vom jeweiligen konkreten Speicher verdankt. Die meisten digital 
born Quellen existieren bereits in mehreren Kopien, noch bevor sie bewusst ver- 
vielfältigt oder gespeichert werden. Matthew Kirschenbaum diskutiert die er- 
staunliche Stabilität und Permanenz digital-elektronischer (Text-)Dateien einge- 
hend: 


Creating a file and saving it to a hard drive does not yield a simple one-to-one correspon- 
dence between the document (or file of whatever type) and its record on the disk. First, 
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word processors and other productivity software routinely include an auto-save function 
that writes a snapshot of an open file to the disk at set intervals. [...] This phenomenon is 
sometimes known as “ambient data”, the term emphasizing the way in which records ac- 
cumulate on a file system absent the intervention of any single, conscious (human) 
agency.! 


Dieser Prozess der Vervielfaltigung durch identische Kopien setzt sich auf be- 
wussterer Ebene durch Backup-Routinen kliigerer Computer-Nutzer:innen fort 
sowie auf eher unbewusster Ebene durch die zahllosen Kopien, die eine simple 
Email auf ihrem Weg durch das Netz auf allen beteiligten Servern generiert. Die- 
se Vervielfältigung und die durch sie bewirkte Stabilisierung erschöpft sich 
nicht im (semantischen) Inhalt von Dateien, sondern erfasst auch eine Myriade 
in ihnen enthaltener Metadaten wie Zeitstempel und Log-files. Originär digitale 
Quellen sind also von der paradoxen Qualität gekennzeichnet, dass sie gleich- 
zeitig als ephemer, flüchtig und volatil beschrieben werden können, aber auch 
als stabil und persistent. 

Ein drittes Paradox, das digital born Quellen zu eigen ist, liegt in ihrer 
gleichzeitigen Virtualität und Materialität begründet. In die Alltagssprache ein- 
gegangene Metaphern wie „virtueller Raum“ oder „cloud“ suggerieren geradezu 
metaphysische Qualitäten digitaler Informationen, wie Ubiquität und Unabhän- 
gigkeit von Energie, Arbeit, Speicherformaten oder Speichermedien. Diese idea- 
listische Wahrnehmung wird jedoch zunehmend in Frage gestellt und mitunter 
scharfer Kritik unterzogen durch Arbeiten, die auf die infrastrukturellen Voraus- 
setzungen der Digitalisierung und des Internets verweisen, oder ihre ökologi- 
schen Kosten betonen und ihre Grundlagen in einer globalen sowie innergesell- 
schaftlichen ökonomischen Ungleichheit und ausbeuterischen Arbeitsverhält- 
nissen herausarbeiten.” Abgesehen von dieser notwendigen Einbettung 
digitaler Objekte in die physische Um-Welt wirft die Materialität digitaler Medi- 
en bedeutsame Fragen für Archiv- und Geschichtswissenschaft auf. Denn wenn- 


12 Matthew G. Kirschenbaum, Mechanisms: New Media and the Forensic Imagination, (Cam- 
bridge, Mass: MIT Press, 2012), 51. 

13 Siehe beispielhaft: Lisa Parks und Nicole Starosielski (Hg.), Signal Traffic: Critical Studies of 
Media Infrastructures, The Geopolitics of Information (Urbana: University of Illinois Press, 2015); 
Dirk van Laak, Alles im Fluss: die Lebensadern unserer Gesellschaft - Geschichte und Zukunft 
der Infrastruktur (Frankfurt a.M.: S. Fischer, 2018); Michael Homberg, „Mensch/Mikrochip. Die 
Globalisierung der Arbeitswelten in der Computerindustrie 1960 bis 2000 - Fragen, Perspekti- 
ven, Thesen,“ Vierteljahrshefte für Zeitgeschichte 66/2 (2018): 267-293; Nathan Ensmenger, 
„The Environmental History of Computing,“ Technology and Culture 59/4S (2018): 7-33; Robert 
Markley, „Boundaries: Mathematics, Alienation, and the Metaphysics of Cyberspace,“ in Vir- 
tual Realities and their Discontents, hg. v. Dems. (Baltimore ML: Johns Hopkins University Press 
1996), 55-78. 
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gleich digitale Objekte nicht notwendig an individuelle Computersysteme und 
Speichermedien gebunden sind (im Sinn von ,,ein ganz bestimmtes System oder 
mein persönlicher Computer/USB-Stick, diese oder jene Festplatte oder Rechen- 
zentrum“), so können sie doch notwendigerweise nur in und auf spezifischen 
Speichern und Systemen existieren und funktionieren. Originär digitale Quellen 
sind wie alle digitalen Objekte stets mindestens an einem spezifischen Ort phy- 
sisch und materiell präsent und funktional von einem spezifischen informatio- 
nellen System zu ihrer Verarbeitung und Darstellung abhängig. Wie Matthew 
Kirschenbaum in seiner Analyse der „Grammatologie des Hard-Drives“ heraus- 
gearbeitet hat, handelt es sich auch bei digital gespeicherten Informationen 
letztlich um „Inschriften“, also physische und materielle Repräsentationen auf 
einer Trägersubstanz. Diese kann vorliegen etwa in Form von elektromagneti- 
schen Polarisierungen auf einer Festplatte, CD-ROM oder Diskette, oder in den 
festgehaltenen elektrischen Spannungen in den Zuständen der einzelnen Halb- 
leiter in einem Flash-Speicher, wie etwa in USB-Sticks oder SD-Karten.'* Damit 
unterscheiden sich die modernsten Speichermedien in ihren Funktionsprinzipi- 
en und ihrer Materialität letztlich nicht von den Lochkarten der Frühzeit der In- 
formations- und Computertechnologie, in denen die jeweiligen Informationen 
eingestanzt waren. Jedes Speichermaterial ist dabei durch Verfall und Verlust 
gefährdet - wenngleich in verschiedener Weise und in verschiedenem Tempo - 
indem es physisch degradiert oder entsprechende Hardware zur Auslese nicht 
mehr zur Verfügung steht.” Selbst wenn es gelingt, einem obsoleten Speicher- 
medium historische Datensätze zu entreißen, ist damit keineswegs sicherge- 
stellt, dass diese dann sinnvoll ausgewertet oder auch nur gelesen werden kön- 
nen. Denn die oben schon thematisierte Obsoleszenz betrifft nicht nur Hard- 
ware, sondern auch Software. Dieses Problem betrifft keineswegs nur digital 
born Quellen und entsprechende Anwendungen aus der Frühzeit des Computer- 
zeitalters. Schon Datenbankanwendungen, Textprogramme und Webanwen- 
dungen aus den frühen 1990er Jahren lassen sich nur unter größten Mühen les- 


14 Einzelne Bits auf elektromagnetischen Speichermedien wie Festplatten lassen sich sogar 
mit einem Elektronenrastermikroskop erkennen und darstellen, vgl. Kirschenbaum, Mecha- 
nisms, 62. 

15 Ein anschauliches Beispiel dafür sind die geradezu heroischen Bemühungen der Beschäf- 
tigten der Bundesbeauftragten für die Stasiunterlagen, die auf Magnetbändern und Magnet- 
platten gespeicherten digitalen Hinterlassenschaften der Stasi und anderer DDR Behörden 
zu erschließen, siehe: Birgit Salamon, „Die archivfachliche Arbeit an den MfS-Geheimdienst- 
unterlagen - Fragen und Herausforderungen,“ Der Archivar 55/3 (2002): 203, https://www. 
bstu.de/archiv/fachbeitraege/die-archive-der-bundesbeauftragten-fuer-die-stasiunterlagen- 
bstu-die-archivfachliche-arbeit-an-den-mfs-geheimdienstunterlagen-fragen-und-herausforde 
rungen/. Zugriff am 19.02.2022. 
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bar machen, geschweige denn ihr historischer Anwendungszusammenhang 
und ihr Aussehen wiederherstellen.'° Originär digitale Quellen haben somit die 
paradoxe Eigenschaft, dass sie zwar einerseits abstrakte und digitale Repräsen- 
tationen von Informationen darstellen, gleichzeitig aber ihre Materialität und 
ihre Gebundenheit an spezifische Hard- und Software die archivalische Bewah- 
rung und geschichtswissenschaftlichen Analyse maßgeblich beeinflussen. Das 
jeweilige physische Substrat eines digitalen Objekts, seine jeweilige funktional- 
informationelle Umgebung, und letztlich auch sein historisch-sozialer Kontext 
sind jedoch zugleich die Schlüssel zu seiner Kritik und Analyse als geschichts- 
wissenschaftliche Quelle. 


2 Historische Praxeologie und „material turn“: 
Konzeptionelle und methodische Zugänge 


Der ehemalige Leiter der Abteilung für elektronische Dokumente am US-ameri- 
kanischen Nationalarchiv, Kenneth Thibodeau, hat der Archivwissenschaft und 
der Geschichtswissenschaft eine konzise analytische Definition digitaler Objek- 
te zur Verfügung gestellt. Nach dieser vielzitierten Definition hat jedes digitale 
Objekt spezifische physikalische, logische und konzeptuelle Eigenschaften: 


All digital objects are entities with multiple inheritance; that is, the properties of any digi- 
tal object are inherited from three classes. Every digital object is a physical object, a logi- 
cal object, and a conceptual object, and its properties at each of those levels can be signif- 
icantly different. A physical object is simply an inscription of signs on some physical 
medium. A logical object is an object that is recognized and processed by software. The 
conceptual object is the object as it is recognized and understood by a person, or in some 
cases recognized and processed by a computer application capable of executing business 
transactions.” 


16 Die Bemühungen des Marbacher Literaturarchivs, den in jeder Hinsicht obskuren Nachlass 
Friedrich Kittlers zu erschließen, künden von den vielfältigen Schwierigkeiten eines solchen 
Unterfangens im Umgang mit born-digitals. Der späte Kittler war Linux-Enthusiast und begeis- 
terter Autodidakt im Umgang mit Computern, weshalb seine Verzeichnis- und Ablagelogik ein- 
zigartig ist und er auch mit selbst geschriebenen Programmen arbeitete. Neben diesen quali- 
tativen Herausforderungen sorgt zugleich der schiere Umfang des Nachlasses mit gut einem 
Terrabyte für anhaltende Beschäftigung in Marbach: https://www.mww-forschung.de/born-di 
gitals. Zugriff am 19.02.2022. 

17 Kenneth Thibodeau, „Overview of Technological Approaches to Digital Preservation and 
Challenges in Coming Years,“ CLIR and the Library of Congress, The State of Digital preserva- 
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In eine ganz ähnliche Richtung entwickelte Matthew Kirschenbaum seine Uber- 
legungen zur Materialität digitaler Artefakte. Er unterscheidet zwischen einer 
formalen und einer forensischen Materialität. Erstere entspricht dabei der Klas- 
se der logischen Objekte in der Definition von Thibodeau, also den (temporä- 
ren) Formen und Eigenschaften, die digitale Objekte im Hinblick und im Aus- 
tausch mit der jeweiligen Software und dem sie umgebenden informationellen 
System haben müssen. Die forensische Materialität entspricht dem, was Thibo- 
deau die physikalische Ebene nennt, also die manifeste Markierung auf einer 
physischen Substanz.'® 

Von großer theoretischer Bedeutung ist auch die von Niels Brügger einge- 
führte analytische Differenzierung zwischen (retro-)digitalisierten Quellen, born 
digital und re-born digital Quellen. Vor allem die letzte Gattung hat weitrei- 
chende analytische Konsequenzen, da sie auf den Umstand verweist, dass digi- 
tal born Quellen, welche zu Forschungszwecken aus ihrem Entstehungskontext 
extrahiert und zur Analyse aufbereitet und angereichert werden, letztlich mit 
den Originalen nicht mehr identisch sind." 

Wichtige Impulse verdankt die Diskussion um die Materialität digitaler Ob- 
jekte schließlich Paul Dourishs Untersuchung der Auswirkungen von Materiali- 
tat(en) auf den Inhalt von Daten. In Fallstudien zu Tabellenkalkulationspro- 
grammen, Datenbanken und der Infrastruktur des Internets zeigt Dourish, dass 
sich die logische beziehungsweise formale Materialität von Daten und ihre je- 
weiligen Eigenschaften durch jeweils spezifische Anforderungen und Möglich- 
keiten informationelle, aber auch soziale Praktiken determinieren, ihnen also 
im Sinne Bruno Latours agency, oder doch zumindest Eigensinn zugesprochen 
werden kann.”° 

Originär digitale Quellen erfordern einen quellenkritischen Zugang wie alle 
anderen Quellen auch, also eine Auseinandersetzung mit ihrem Entstehungs- 
kontext, der mit ihnen möglichen Interaktionen sowie ihrer jeweiligen Rolle 
und Wirkmächtigkeit in Diskursen und politischen Dynamiken. Das häufigste 
informationelle Ökosystem historischer digitaler Quellen sind Datenbanken. In 
einem Arrangement von Klassen und Kategorien, Spalten und Zeilen sowie de- 


tion: An International Perspective, April 2002, https://www.clir.org/pubs/reports/pub107/thibo 
deau/. Zugriff am 19.02.2022. 

18 Kirschenbaum, Mechanisms, 13-17. 

19 Niels Briigger, The Archived Web. Doing History in the Digital Age (Cambridge, MA: MIT 
Press, 2018), 21-23. 

20 Dourish, The Stuff of Bits, 202-206; Edwin Sayes, „Actor-Network Theory and Methodology: 
Just What Does It Mean to Say That Nonhumans Have Agency?“ Social Studies of Science 44/1 
(2014): 134-149. 
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ren Sortierung wurden und werden die meisten Daten aggregiert, gespeichert 
und verarbeitet. Von der einfachen Tabelle bis zu komplexen relationalen Da- 
tenbanken und modernen NoSQL-Systemen gehören Datenbanken zu den wich- 
tigsten Infrastrukturen und Ordnungssystemen des Informationszeitalters.”! In 
der Auswahl und Benennung von Attributen und Kategorien einer jeweiligen 
Datenbank sind wichtige konzeptionelle Vorannahmen und Entscheidungen 
enthalten, die den einzelnen Datenpunkten einen Sinnzusammenhang verlei- 
hen. Diese Entscheidungen für eine gewisse Repräsentation der Welt und gegen 
mögliche andere, können ihrerseits wiederum Rückwirkungen auf die (reale) 
Welt haben, indem sie bestimmte Wahrnehmungen und Interpretationszusam- 
menhänge gegenüber anderen begünstigen. Diese sinnstiftende Wirkung von 
Datenbaken hat Rob Kitchin konzise beschrieben: 


Databases and data infrastructures are not simply neutral, technical means of assembling 
and sharing data; they are not merely products that store captured data about the world, 
but are bundles of contingent and relational processes that do work in the world. They 
are complex sociotechnical systems that are embedded within a larger institutional land- 
scape of researchers, institutions and corporations, constituting essential tools in the pro- 
duction of knowledge, governance and capital.” 


Für die Geschichtswissenschaft und insbesondere die an digital born Quellen 
interessierte Digital History ergibt sich daraus eine zwingende quellenkritische 
Notwendigkeit, sich eingehender mit Datenbanken zu befassen.” 

Datenbanken funktionieren und existieren nur auf Grundlage und im Ver- 
bund mit ihrem jeweiligen Betriebssystem, dem Database Management System 
(DBMS). Datenbanken sind somit nicht nur reine Speichermedien für Daten, sie 
konstituieren Informationen oftmals erst durch ihre Abfrage und die Prinzipien 


21 Zur Geschichte und Funktionsweise der gebräuchlichsten Datenbanksysteme siehe: David 
Gugerli, „Die Welt als Datenbank. Zur Relation von Softwareentwicklung, Abfragetechnik und 
Deutungsautonomie,“ in Daten. Nach Feierabend. Zürcher Jahrbuch für Wissensgeschichte 3, 
hg. v. David Gugerli et al. (Zürich/Berlin: Diaphanes, 2007), 11-36; Marcus Burkhardt, Digitale 
Datenbanken: eine Medientheorie im Zeitalter von Big Data (Bielefeld: Transcript, 2015); Markus 
Krajewski, ZettelWirtschaft. Die Geburt der Kartei aus dem Geiste der Bibliothek (Berlin: Kultur- 
verlag Kadmos, 2002). Zum Begriff und Konzept des „Informationszeitalters“: James R. Beniger, 
The Control Revolution: Technological and Economic Origins of the Information Society (Cam- 
bridge, Mass.: Harvard University Press, 1997). 

22 Rob Kitchin, The Data Revolution: Big Data, Open Data, Data Infrastructures & their Conse- 
quences (Los Angeles: SAGE Publications, 2014), 51 

23 Pascal Föhr, Historische Quellenkritik im Digitalen Zeitalter, Dissertation, Universität Basel 
2018, doi: 10.5451/unibas-006805169, hier vor allem 47. 
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ihrer Ablage- und Aggregationsroutinen.“ Damit ergeben sich mehrere analyti- 
sche Perspektiven zu ihrer Erforschung und Historisierung: Databasing kann 
verstanden werden als epistemologischer Zugang zur Ordnung der Welt, der 
aus der Unterteilung von Eindrücken und Erfahrungen in signifikante und un- 
wichtige Signale besteht, deren Unterteilung in diskrete Einheiten und deren 
Einordnung in ein Klassifikationssystem aus Attributen, Kategorien und Wer- 
ten.” Databasing ist zugleich eine (oftmals kollektive) sozio-technische Praktik, 
in der die epistemologisch-konzeptionelle Vorarbeit der Datafizierung im Medi- 
um digitaler Datenbanksysteme realisiert und operationalisiert wird. Diese 
Praktik besteht zunächst aus der Eingabe, Manipulation und Abfrage der Daten, 
dehnt sich aber auch auf die Diskussionen der beteiligten Menschen unterein- 
ander und ihrer oftmals nicht reibungslosen Interaktion mit den Maschinen 
aus.” Nicht zuletzt kann Databasing als Versuch verstanden werden, mithilfe 
der Objektivitätssuggestion computer-generierter Informationen und großer 
Zahlenreihen Evidenz zu produzieren und im Diskurs als strategische Ressource 
einzusetzen.” 

Neuere Strömungen der Computergeschichte wenden sich zunehmend hin 
zu sozialgeschichtlich inspirierten Studien zur Interaktion humaner historischer 
Akteur:innen mit den jeweiligen Systemen und damit weg von Meistererzählun- 
gen über geniale (meist männliche) Erfinder und Pioniere und den von ihnen 
geschaffenen Technologien.” Nicht zufällig geraten durch diese Perspektivver- 
schiebung vermehrt Frauen und ihr Beitrag zur Entwicklung moderner Informa- 


24 Zu Entwicklung und Geschichte von DBMS siehe: Thomas Haigh, „How Data Got its Base: 
Information Storage Software in the 1950s and 1960s,“ in: IEEE Annals of the History of Com- 
puting 31/ 4 (Oktober 2009): 6-25, doi: 10.1109/MAHC.2009.123; Thomas J. Bergin und Thomas 
Haigh, „The Commercialization of Database Management Systems, 1969-1983,“ IEEE Annals of 
the History of Computing 31/4 (Oktober 2009): 26-41, doi: 10.1109/MAHC.2009.107. 

25 Bianca Prietl und Daniel Houben, „Einführung. Soziologische Perspektiven auf die Datafi- 
zierung der Gesellschaft,“ in Datengesellschaft: Einsichten in die Datafizierung des Sozialen, 
hg. v. Dens. (Bielefeld: Transcript, 2018), 7-32, hier vor allem 18. 

26 Ein Beispiel einer historischen Analyse von Databasing-Praktiken ist: Rebecca M. Lemov, 
Database of Dreams: the Lost Quest to Catalog Humanity (New Haven: Yale University Press, 
2015); Zu praxeologischen Ansätzen in der Zeitgeschichte allgemein siehe: Lucas Haasis und 
Constantin Rieske (Hg.), Historische Praxeologie: Dimensionen vergangenen Handelns (Pader- 
born: Ferdinand Schöningh, 2015). 

27 Theodore M. Porter, „Quantification and the Accounting Ideal in Science,“ Social Studies of 
Science 22/4 (1992): 633-651; Alain Desrosiéres, The Politics of Large Numbers: A History of 
Statistical Reasoning (Cambridge, Mass.: Harvard University Press, 2011). 

28 Programmatisch formuliert bei: Thomas Haigh, „Introducing the Early Digital,“ in Explo- 
ring the Early Digital, hg. v. Dems. (Cham: Springer International Publishing, 2019), 1-18, doi: 
10.1007/978-3-030-02152-8_1. 
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tions- und Kommunikationstechnologien in den Blick.” Zudem entfaltet der 
Blick weg vom Computer und hin zum ihn bedienenden und wartenden Perso- 
nal (und - seit der Durchsetzung des Personal Computers - auch zu privaten 
Anwender:innen) ein Panorama der Arbeitswelt und Kultur im Informations- 
zeitalter, das weit tiber die Labore und Biiros des Silicon Valley mit ihren obli- 
gaten Yogamatten und Tischtennisplatten hinausreicht.*° 

Um die Funktionsweise historischer Informationsverarbeitungssysteme und 
die Interaktion daran beteiligter Personengruppen besser verstehen zu können, 
ist es mitunter hilfreich, historische Systeme zu reaktivieren und historische 
Praktiken durch Reenactment nachzuvollziehen. Diese Vorgehensweise immu- 
nisiert gegen teleologische Rückprojektionen, in denen historische Phänomene 
zu bloßen Vorläufern und Stationen auf dem Weg zur Gegenwart (und damit 
ihrer Vollendung) degradiert werden.*! Eine direkte Auseinandersetzung mit 
der historischen Technik ermöglicht zugleich Einsichten in die für ihr Funktio- 
nieren notwendigen Arbeiten und die Grenzen mit solcher Technik möglichen 
Datenverarbeitung. Insbesondere Forschungen zur Frühgeschichte der Digitali- 
sierung profitieren dabei vom Austausch mit technischen Sammlungen und Mu- 
seen, um ein Verständnis für Computer zu entwickeln, die keine der heute gän- 
gigen Schnittstellen wie grafische Benutzeroberflächen und Computer-Maus, ja 
nicht einmal Bildschirme aufwiesen.” Das Potential der hier vorgestellten theo- 
retischen Zugänge soll nun im Folgenden anhand einer konkreten Fallstudie 
skizziert werden. 


29 Marie Hicks, Programmed Inequality: How Britain Discarded Women Technologists and Lost 
Its Edge in Computing, History of Computing (Cambridge, MA: MIT Press, 2018); Janet Abbate, 
Recoding Gender: Women’s Changing Participation in Computing (Cambridge, Mass.: MIT Press, 
2017). 

30 David N. Pellow und Lisa Sun-Hee Park, The Silicon Valley of Dreams: Environmental Injus- 
tice, Immigrant Workers, and the High-Tech Global Economy, Critical America (New York: New 
York University Press, 2002); Nathan Ensmenger, The Computer Boys Take Over: Computers, 
Programmers, and the Politics of Technical Expertise (Cambridge, Mass.: MIT Press, 2010); für 
neuere Perspektiven auf die Computernutzung in Westdeutschland siehe: Frank Bösch (Hg.), 
Wege in die digitale Gesellschaft: Computernutzung in der Bundesrepublik 1955-1990 (Göttingen: 
Wallstein Verlag, 2018). 

31 Thomas Haigh, Mark Priestly und Chrispin Rope haben mit ihrer Studie zur Funktionsweise 
(bzw. deren häufiges Ausbleiben) des „ersten modernen Computers“ ENIAC vorbildlich de- 
monstriert, dass ein detaillierter Nachvollzug und eine entsprechende „dichte Beschreibung“ 
eine große Zahl weit verbreiteter Mythen aufzudecken und zu dekonstruieren vermag: Thomas 
Haigh, Mark Priestley und Crispin Rope, ENIAC in Action: Making and Remaking the Modern 
Computer (Cambridge MA: MIT Press, 2018). 

32 Haigh, „Introducing the Early Digital“; Lori Emerson, Reading Writing Interfaces: From the 
Digital to the Bookbound (Minneapolis: University of Minnesota Press, 2014). 
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3 Fragmente einer Kriegsmaschine 


Wahrend des Vietnamkriegs versuchten die Amerikaner und ihre Verbiindeten, 
ihre technische Uberlegenheit gegeniiber der hochmotivierten und von der Lo- 
kalbevölkerung unterstützte Guerillabewegung des Vietcong auszuspielen. 
Auch Computer, Datenverarbeitungssysteme und Datenbanktechnologie kamen 
dabei zum Einsatz. Die Überreste dieses frühen Versuchs, mithilfe von elektro- 
nischer Datenverarbeitung komplexe soziale Dynamiken zu erfassen und zu 
modellieren, werden in verschiedenen Formaten vom US-Nationalarchiv aufbe- 
wahrt. An ihnen lässt sich zeigen, wie die oben genannten Eigenschaften origi- 
när digitaler Quellen, vor allem ihre formal-logische und physische Materialität, 
für ihre Analyse und Kritik fruchtbar gemacht werden können. 

Als der 1961 ins Amt gekommene US-Präsident John F. Kennedy den Ford- 
Manager Robert S. McNamara zum neuen Verteidigungsminister ernannte, war 
dies fiir viele Beobachter:innen, aber auch fiir den Berufenen selbst eine Uber- 
raschung. Der Uberraschungseffekt erfasste ebenso die militärische Führung 
der USA, denn der neue Minister begann sogleich mit einer rigorosen Umstruk- 
turierung der Streitkräfte, die alsbald als revolutionär bezeichnet wurde. Unter 
dem Eindruck des rasch eskalierenden Kalten Krieges und der thermonuklearen 
Bedrohung setzte McNamara seine Kompetenz und Macht ein, um dem US-Mili- 
tär nicht nur strategische Überlegenheit zu sichern, sondern auch Effizienz und 
durchaus zugleich finanzielle Rentabilität. Bei der Durchsetzung dieser Ziele ge- 
gen den nicht unerheblichen Widerstand der militärischen Elite unterstützte 
ihn ein Stab aus ehemaligen Weggefährten aus der Harvard Business School, 
die in der Behörde bald als „whiz kids“ bezeichnet wurden (was sich sinngemäß 
mit „Klugscheißer“ übersetzen ließe). Ähnlich rigoros wie McNamara zu Beginn 
seiner Amtszeit Armee und Luftwaffe einer strengen Kosten-Nutzen-Kontrolle 
unterworfen und strategische Machtprotektion logistisch interpretiert hatte, 
machte er auch den Vietnamkrieg 1967 zur Chefsache, nachdem das seit 1965 
stetig intensivierte Engagement der US-Armee nicht zur erwünschten Stabilisie- 
rung des südvietnamesischen Regimes und der Eindämmung der kommunisti- 
schen Guerilla geführt hatte. Als typischer Manager seiner Zeit und glühender 
Verfechter des Operations Research und der Systemanalyse verlangte er ein „ob- 
jektives“ Bild der Verhältnisse, auf das künftige politische und militärische Ent- 


33 Charles R. Shrader, History of Operations Research in the United States Army, V. 2, 1961-1973 
(U.S. Department of Defense, U.S. Army Center of Military History, 2008), 37-68; Charles A. 
Stevenson, Warriors and Politicians. US Civil-Military Relations Under Stress (New York: Rout- 
ledge, 2006), 153-164. 
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scheidungen gegründet sein sollten.”* Wenig verwunderlich sollte diese Objekti- 
vität mit den modernsten Methoden der Datensammlung und -analyse — also 
mit modernen Computern - erreicht werden. Schon vor 1967 setzte die US-Ar- 
mee in Vietnam Computer ein, etwa zur Verwaltung ihrer Logistik oder der Ab- 
wicklung der Soldzahlungen und Urlaubsansprüche der Truppe. Auch mit aus 
heutiger Sicht bizarren Ansätzen wurde experimentiert, etwa bei der Verkabe- 
lung des Ho-Chi-Minh-Pfades mit Urin- und Geräuschsensoren, um Bombardie- 
rungen auf die Nachschublieferungen des Vietcong automatisiert auszulösen.” 
In der Konsequenz eskalierend wirkten sich Versuche einer statistischen Be- 
trachtung und Steuerung des Kriegsgeschehens im berühmten „body count“ 
aus, durch den der militärische Druck auf die kommunistische Guerilla quantifi- 
zierbar gemacht werden sollte, wo Informationen zu ihrer Truppenstärke fehl- 
ten.” 

Die seit 1967 eingerichteten Systeme zur statistischen Erfassung der „Pazifi- 
zierung“ der südvietnamesischen Landgebiete zeichneten sich demgegenüber 
durch ihren holistischen Anspruch und ihre (sozial-)wissenschaftliche Beglei- 
tung aus.” Um die Aufstandsbekämpfung der südvietnamesischen Armee und 
ihres amerikanischen Alliierten aus der ewigen Wiederkehr eines Katz-und- 
Maus-Spiels zu befreien, das sich in wirkungslosen „search und destroy“ Mis- 
sionen erschöpfte, und um der breiten Unterstützung der Guerilla durch die 
Landbevölkerung auch politisch zu begegnen, richtete Präsident Lyndon B. 
Johnson 1967 eine zivil-militärische Super-Behörde unter Leitung des US-Bot- 


34 Joy Rohde, Armed with Expertise: The Militarization of American Social Research During the 
Cold War (Ithaca: Cornell University Press, 2013); Sharon Weinberger, The Imagineers of War: 
The Untold Story of DARPA, the Pentagon Agency that Changed the World (New York: Vintage 
Books, 2018); Torben Lütjen, „Vom ‚Gospel of Efficiency‘ zum ‚War of Ideas‘. Zum Verhältnis 
von Wissenschaft, Politik und Ideologien in den Vereinigten Staaten,“ Archiv für Sozialge- 
schichte 50 (2010): 373-394. 

35 Paul N. Edwards, The Closed World: Computers and the Politics of Discourse in Cold War 
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schafters Robert Komer ein, das Biiro fiir Civil Operations and Revolutionary De- 
velopment Support (CORDS).*® Hier sollten die Informationen aus den verschie- 
denen Quellen der US-Armee (Military Assistance Command, Vietnam, MACV), 
des Verteidigungsministeriums, der CIA, der Agency for International Develop- 
ment (AID) und der Südvietnamesischen Regierung und Streitkräfte gebündelt 
und koordiniert werden. Voraussetzung für eine effektive Koordination der Auf- 
standsbekämpfung war ein umfassendes Wissen über die Landbevölkerung, de- 
ren „Herzen und Köpfe“ zu gewinnen waren. Dieses Wissen sollte durch ein 
computerisiertes Daten-Verarbeitungssystem gewährleistet werden, das Hamlet 
Evaluation System, HES. Dieses im Januar 1967 in Betrieb genommene Daten- 
banksystem enthielt einen Index sämtlicher rund 12000 Dörfer und Weiler un- 
ter der Kontrolle des südvietnamesischen Regimes und seiner Alliierten, inklu- 
sive demographischer Informationen und geografischer Koordinaten, Einschät- 
zungen zur Sicherheitslage und Indikatoren zur jeweiligen sozio-ökonomischen 
Situation, Selbstverwaltung, Entwicklungspotentiale und so weiter. Zusätzlich 
zu diesen Grunddaten erhoben speziell geschulte Teams regelmäßig Daten zu 
den politischen Einschätzungen, Zukunftserwartungen und Moralvorstellungen 
der Bevölkerung, anhand derer die Wirksamkeit einzelner Maßnahmen militari- 
scher Repression, psychologischer Kriegsführung und sozioökonomischer Ent- 
wicklungsinitiativen evaluiert und somit gezielter dosierbar gemacht werden 
sollten. Einige der renommiertesten Sozialwissenschaftler:innen der USA betei- 
ligten sich an der Konzeption und Operationalisierung dieses Großversuchs in 
angewandter Sozialforschung. Angeschlossene Teilsysteme wie das psychogra- 
phisch orientierte Pacification Attitudes Analysis System (PAAS) oder die mit 
Vietcong-Deserteuren durchgeführten Interviews im Rahmen des „Chieu Hoi“ 
Programms (Offene Arme) flossen später in Publikationen beteiligter Wissen- 
schaftler:innen und in die Fachdiskurse der quantitativen Sozialwissenschaften 
sowie der Formulierung der Modernisierungstheorie ein.” Ein auf Grundlage 
der Erfahrungen mit der Aufstandsbekämpfung in Vietnam entwickeltes System 
zur Früherkennung potentieller (kommunistisch inspirierter) Aufstände in den 
Vereinigten Staaten selbst, das „Project Camelot“, provozierte schließlich den 
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Protest kritischer Forschender und der politisierten Studentenorganisationen 
der späten 1960er Jahre.’° Dieser kritischen Einordnung der im Vietnamkrieg 
eingesetzten Systeme und auch der sie begünstigenden technokratischen, kalt- 
blütigen Mentalität hat sich die Geschichtswissenschaft später größtenteils an- 
geschlossen.“ Allerdings befasste sich die historische Forschung bislang vor al- 
lem mit der Rolle computerbasierter Analysen in der strategischen Entschei- 
dungsfindung der US-Streitkräfte und weniger mit dem Funktionieren, 
geschweige denn der Praxis und Materialität der Datenverarbeitung. 

Die Datenverarbeitung des HES bestand aus einem mehrstufigen Prozess, 
in dessen Verlauf die Datensätze auf verschiedenen Medien gespeichert und 
verarbeitet wurden, sich ihr Informationsgehalt durch Aggregation und Prozes- 
sierung mitunter erheblich änderte und an dem eine ganze Reihe sehr verschie- 
dener historischer Akteure beteiligt waren. Am Beginn standen auf Karton ge- 
druckte Fragebögen. Die Fragebögen und ihre Auswertungsmatrix waren von 
einem Team aus Sozialwissenschaftlern um den Politologen Ithiel de Sola Pool 
entwickelt worden, der durch die Computer-basierte Berechnung von Wahler- 
gebnissen Bekanntheit erlangt hatte.“ Die Karten bestanden aus insgesamt 136 
Fragen zu 18 Indikatoren aus den Bereichen Politik, Sicherheit, Wirtschaft, Ver- 
waltung und Gesundheit, die jeweils in einer fünfstufigen Skala zu bewerten 
waren. Teams aus jeweils einem amerikanischen Offizier (District Senior Advi- 
sor, DSA) und einigen vietnamesischen Assistenten und Übersetzern wurden in 
jedem der 256 militärischen Sub-Distrikte monatlich ausgeschickt, um die Situa- 
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Louis Horowitz, The Rise and Fall of Project Camelot: Studies in the Relationship between Social 
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41 James William Gibson, The Perfect War: Technowar in Vietnam (New York: Atlantic Monthly 
Press, 2000); Thomas C Thayer, War Without Fronts (Naval Institute Press, 2016); Oliver Bel- 
cher, „Data Anxieties: Objectivity and Difference in Early Vietnam War Computing,“ in Algo- 
rithmic Life: Calculative Devices in the Age of Big Data, hg. v. Louise Amoore und Volha Piotukh 
(New York: Routledge, 2016), Kap. 7. 
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tion in allen Dörfern und Weilern zu erfassen und auf den Karten einzutragen.“ 
Am Ende des Monats musste der DSA die Ergebnisse seiner Erhebungen inklu- 
sive zusätzlicher Bemerkungen auf einem vorgedruckten Formblatt eintragen 
und an das Provinz-Hauptquartier weiterleiten, wo die Formblätter gesammelt, 
auf Vollständigkeit und Kohärenz überprüft und schließlich nach Saigon in das 
CORDS-Hauptquartier weitergeleitet wurden. Dort wurden die Blätter von der 
Reports and Analysis Division (RAD) erneut geprüft und sortiert.“ In der Data 
Management Agency des Oberkommandos wurden die Formblätter schließlich 
von angestellten Vietnamesinnen auf Lochkarten gestanzt und dann in die 
Computer eingespeist. Auf Grundlage dieser monatlich aktualisierten Daten be- 
rechneten Analysten des RAD (zum Teil Militärs und Geheimdienstler, aber 
auch zivile Sozialwissenschaftler und Angestellte privater Datenverarbeitungs- 
Firmen unter Regierungsvertrag) Veränderungen und Prognosen zur politisch- 
militärischen Situation. Die Resultate wurden schließlich in den monatlich er- 
scheinenden „Southeast Asia Analysis Reports“ zusammengefasst, auf riesigen 
Karten geplottet und der gesamte Monatsreport zusätzlich in mehrfacher Aus- 
führung auf Endlospapier ausgedruckt.“ Die schiere Menge der im HES verar- 
beiteten Daten war für damalige Verhältnisse beispiellos: 9000 Lochkarten 
wurden monatlich gestanzt, 10 Millionen Einträge enthielt das Masterfile auf 
mehreren Magnetbändern und 90 000 Seiten umfassten die Reports. Insgesamt 
produzierte das Oberkommando der US-Streitkräfte in Vietnam sagenhafte 
sechs Tonnen bedrucktes Papier, weshalb der Vietnamkrieg bis heute als einer 
der am besten dokumentierten militärischen Konflikte des 20. Jahrhunderts 
gilt. Dieses gewaltige und komplizierte Unterfangen war an verschiedenen 
Stationen des Prozederes anfällig für Fehler und Verluste, die nicht nur an der 
mitunter eingeschränkten Zuverlässigkeit der Befragten und an der Erhebungs- 
praxis, oder an der allgemeinen Unübersichtlichkeit des Guerilla-Krieges lagen, 
sondern auch an der jeweiligen Materialität der Speichermedien. Die Frage-Kar- 
ten für die einzelnen Dörfer schafften es zum Beispiel oftmals nicht bis ins Pro- 
vinzhauptquartier, etwa wenn sie bei Gefechten verloren gingen, durch das 
Dschungelklima, Regen oder Matsch zerstört oder durch Nagetierfraß beschä- 
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digt wurden.”’ Das System erwies sich außerdem oft als zu statisch, um die Dy- 
namik des Krieges und seiner Konsequenzen zu erfassen. So wussten sich die 
Analysten nicht anders zu behelfen, als die Millionen von Binnenfliichtlingen 
unter der Kategorie ihrer Herkunftsdörfer zu erfassen, was das Gesamtbild oft- 
mals bis ins Absurde verzerrte.”® Entsprechende Revisionen des Systems in den 
Jahren 1970 und 1971 führten zu weiteren Problemen. So sollte 1970 die Genau- 
igkeit des Systems verbessert werden, indem weitere Fragen auf die Dorf-Karten 
aufgenommen wurden. Diese erweiterte Matrix passte dann allerdings nicht 
mehr auf eine einzige Lochkarte, was zu einer Verdoppelung der benötigten 
Menge an Lochkarten und damit zu weiteren potentiellen Fehlern und Unge- 
nauigkeiten führte.“ Eine Revision der Verarbeitungsroutinen und damit der lo- 
gisch-formalen Materialität der Datensätze zog zudem stets eine aufwändige 
Neuprogrammierung des Systems nach sich, da Abfrage-Codes neu geschrieben 
werden mussten, wie ein mit diesen Arbeiten befasster Programmierer resi- 
gniert zu Protokoll gab: 


The HES/70 system has been advertised as a variable, flexible, easily changed system that 
can accept new questions and models with little or no trouble. This is true only of the sys- 
tem programs involved in generating the data base. The Edit-A, Edit-B, update, scoring, 
scoring merge and derived processor can be revised very easily by generating a new QTAB 
and making a few small program modifications. The problem starts with the programs 
that were written to interrogate the data base. In most cases the programs were written 
‘quick and dirty’ in order to satisfy the customer’s need for reports with the idea that the 
programs would be rewritten at a later date utilizing the QTAB and copy FDs. If the pro- 
grams are modified to accept the revised data base what will happen when the second 
revision takes place, modification of modifications. Each time a program is altered some 
of the original smooth flow is lost. After several modifications even the author has trouble 
following the program.” 


Die Computer selbst schließlich, raumfüllende IBM 360/40 Maschinen, waren 
enorm wartungsintensiv und fielen zudem durch Feuchtigkeit und häufige 
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Stromausfälle oft tagelang aus. Ein ehemaliger IBM-Programmierer, Dan 
Feltham, berichtete von den schwierigen Betriebsbedingungen in den Rechen- 
zentren in Saigon: 


The USAID computer rooms had water pipes and air ducts running across the low ceilings 
and early on there was no raised floor that normally covered computer cables. Anyone 
walking through the area had to duck, bob, and weave as they picked their way around 
the machines and stepped over the thick cables. Whenever we had to add some new IBM 
equipment, figuring out where to put it was like solving a large jigsaw puzzle [...]. At an- 
other nearby machine installation, a 407 tabulating machine suffered an extended outage 
due to rats chewing through the power cables. The CE repairing that machine had to make 
up an imaginative outage code for his work report. Computers are said to have ‘bugs’ but 
they aren’t supposed to have rats.>! 


Auch die Bandspulen, die das Magnetband mit dem Masterfile bewegten, 
brannten durch und nicht alle Magnetbänder waren der hohen Belastung und 
dem tropischen Klima gleich gut gewachsen.” 

Die materiellen Metamorphosen der im Vietnamkrieg generierten Datensät- 
ze und ihre jeweiligen formal-logischen, semantischen und historischen Konse- 
quenzen ziehen sich weiter durch die Überlieferungsgeschichte dieses außerge- 
wöhnlichen Quellenbestandes, die einer eigenen Studie würdig wäre. Eine kar- 
tellrechtliche Klage von vier US-amerikanischen Computerherstellern gegen die 
scheinbare Bevorzugung des marktdominierenden Giganten IBM bei der Verga- 
be von Regierungsaufträgen im Jahr 1969 führte dazu, dass ein Gericht die Zer- 
störung sämtlicher elektronischer Dokumente verbot. Während in den leitenden 
Bürokratien in Regierung und Militär wenig Verständnis für den wissenschaftli- 
chen Wert und die Geschichtsmächtigkeit aberhunderter Meter nur von Maschi- 
nen lesbarer Magnetbänder vorherrschte (und auch die offizielle Politik des Na- 
tionalarchivs vorsah, wichtige Dokumente auszudrucken und die Originale zu 
vernichten), empfahl eine von der RAND-Corporation durchgeführte Studie de- 
ren Bewahrung für künftige historische Forschungen. Dieser Empfehlung wurde 
letztlich entsprochen und die weit verstreuten Bestände in das US-Nationalar- 
chiv überführt. Ein dort ehemals mit diesen Beständen befasster Archivar, Do- 
nald Fisher Harrison, berichtete allerdings 1988, dass die Forschenden Zurück- 
haltung bei der Nutzung dieser Bestände zeigten.” Neben dem schlechten Ruf 
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der Daten als unzuverlässig und propagandistisch habe dies vor allem an ihrem 
Format gelegen: Die Daten waren für eine bestimmte Software konfiguriert und 
formatiert (logische/formale Materialität), ein DBS namens National Information 
Processing System (NIPS). Um die Nutzung zu erleichtern und auch die bis dato 
auf Magnetbändern (physische Materialität) gespeicherten Dateien leichter 
transportabel und übertragbar zu machen, begann das US Nationalarchiv 1978 
einige der als am wichtigsten eingeschätzten Dateien in Software-unabhängige 
Formate zu übertragen (re-born digitals). 

Diese zwei Manifestationen digitaler Quellen - zum einen born, zum ande- 
ren re-born digitals — unterscheiden sich voneinander in mehr als nur ihrem 
Format: Der Bitstream der ursprünglichen NIPS-Dateien enthielt in den vorde- 
ren Sektoren Codes des DBMS, die zur Dateiverwaltung notwendig waren, wie 
etwa Timestamps, File Maintenance Statements und andere Kontrollinformatio- 
nen für die Programmierer. Im Prozess des Transfers in modernere Formate 
wurden diese Sektionen entfernt und in die Dokumentation ausgelagert, jedoch 
nur teilweise. So lässt sich nach der Migration zwar der ursprüngliche konzep- 
tuell/semantische Inhalt der Dateien erschließen, nicht aber ihr logisch-forma- 
ler. 


4 Fazit 


Von der Erhebung der Daten in den Dörfern in Weilern Südvietnams bis zu ihrer 
Übertragung in die Zentralcomputer des Armeekommandos in Saigon und 
schließlich in die Depots und Lesesäle des Nationalarchivs durchliefen die In- 
formationen des HES mehrere Stationen und wurden dabei oftmals auf neue 
physische Speichermedien übertragen, die wiederum jeweils spezifische materi- 
elle Eigenschaften und spezifische formale Anforderungen hatten. Am Beispiel 
des HES lässt sich illustrieren, wie durch den Nachvollzug des Lebenszyklus 
historischer Daten durch ihre mehrfachen konzeptuellen, logischen und physi- 
schen Transformationen hindurch die jeweils beteiligten historischen Akteur:in- 
nen hervortreten. 

Eine gründliche quellenkritische Auseinandersetzung mit dem Datenbank- 
system, seinen Revisionen und der jeweiligen Determiniertheit der Daten durch 
ihre konzeptuelle, logische und physische Materialität offenbart die Unzuläng- 
lichkeit und den konstruierten Charakter des Systems, wirft aber zugleich auch 
interessante Schlaglichter auf die Denkweise und das Erkenntnisinteresse der 
damaligen Akteur:innen. Angesichts der enormen Bedeutung, welche die Erfah- 
rungen mit dem HES-System für die US-amerikanische empirische Sozialfor- 
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schung und die Weiterentwicklung von Datenbanktechnologien hatten, er- 
scheint die Auseinandersetzung mit der Praktik des „Databasing“ und seinen 
ideen- und wissensgeschichtlichen Auswirkungen daher als ein produktiver Zu- 
gang zu dieser schwierigen Quelle. 

Die Analyse der HES-Datenbank und der damit verbundenen Systeme ver- 
sprechen durch seine spezifische Uberlieferungsgeschichte zugleich weiterrei- 
chende Erkenntnisse fiir die archivalische Bewahrung und geschichtswissen- 
schaftliche Erforschung historischer Datenbanken: Auf der Ebene der Archive 
spricht die Erfahrung mit diesem System dafür, eine möglichst umfassende 
Bewahrungspraxis anzustreben, also nicht nur historische Datensätze der For- 
schung zugänglich zu machen, sondern wenn möglich die vollständige Umge- 
bung etwa in Form von emulierten Systemen inklusive extensiver Dokumenta- 
tion zu bewahren.?* Die Geschichtswissenschaft und hier wiederum insbesonde- 
re die Digital History wäre gut beraten, sich in engen Austausch mit Zugängen 
wie der experimentellen Medienarchäologie zu begeben, um ihre eigentliche 
Kernkompetenz, die Kritik und Kontextualisierung von historischen Quellen, 
auch im digitalen Zeitalter nutzbar zu machen.” 
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Melanie Althage 

Potenziale und Grenzen der Topic- 
Modellierung mit Latent Dirichlet Allocation 
fiir die Digital History 


Abstract: Topic Modeling is a widespread method in Digital Humanities and 
Digital History in order to examine the thematic structure of extensive text col- 
lections, such as to trace themes and motifs in novels or publication trends in 
(scientific) journals. Although it represents a large family of algorithms, Latent 
Dirichlet Allocation (LDA), first introduced in 2003, is the de facto standard for 
these purposes. However, the original goals behind the development of LDA dif- 
fer significantly from today’s application scenarios in the humanities and his- 
torical sciences. The article therefore provides an overview of the development 
context and the assumptions underlying the LDA procedure and, on this basis, 
discusses the potentials and limitations relevant for historical research. Limita- 
tions are inherent in the algorithm, especially with regard to the temporality of 
historical data. Accordingly, the article pleads for a stronger reception of further 
developments in the field of Topic Modeling beyond LDA. 


Keywords: digital history, topic modeling, latent Dirichlet allocation, methodo- 
logical criticism, natural language processing, machine learning 


Zusammenfassung: Topic Modeling ist in den Digital Humanities und der Digi- 
tal History eine verbreitete Methode zur Untersuchung der inhaltlich-themati- 
schen Struktur umfangreicher Textkollektionen, etwa um Themen und Motive 
in Romanen oder Publikationstrends in (Fach-)Zeitschriften nachzuvollziehen. 
Obgleich es sich um eine große Familie von Algorithmen handelt, stellt die 
2003 erstmals vorgestellte Latent Dirichlet Allocation (LDA) hierfiir den Quasi- 
Standard dar. Allerdings weichen die urspriinglichen Ziele, die hinter der Ent- 
wicklung von LDA standen, von den heutigen Anwendungsszenarien deutlich 
ab. Der Beitrag zeichnet daher überblickshaft den Entwicklungskontext und die 
dem Verfahren zugrundeliegenden Annahmen nach und erörtert auf dieser Ba- 
sis die für geschichtswissenschaftliche Fragestellungen relevanten Potenziale 
und Grenzen. Insbesondere hinsichtlich der Temporalität historischer Daten 
sind dem Algorithmus Limitierungen inhärent. Der Beitrag plädiert entspre- 
chend dafür, die Weiterentwicklungen im Bereich Topic Modeling über LDA 
hinaus stärker zu rezipieren. 
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Schlagwörter: Digital History, Topic Modeling, Latent Dirichlet Allocation, Me- 
thodenkritik, Natural Language Processing, Machine Learning 


1 Einleitung 


Die informationstechnologischen Entwicklungen seit dem 20. Jahrhundert so- 
wie der sogenannte computational turn veränderten die Art und Weise der geis- 
tes- und geschichtswissenschaftlichen Forschungstatigkeit grundlegend. Nicht 
nur stehen immer mehr digitalisierte und genuin digitale Quellen nahezu zeit- 
und ortsunabhängig zur Verfügung, auch das Set an Werkzeugen und Metho- 
den wandelt und erweitert sich sukzessive. Eine solche Methode ist Topic Mode- 
ling. Sie zielt darauf, statistisch signifikante Sprachgebrauchsmuster in um- 
fangreichen Textkorpora zu identifizieren und Dokumente zu gruppieren, die 
diese Muster miteinander teilen.! Seit rund 15 Jahren wird Topic Modeling in 
den digitalen Geisteswissenschaften eingesetzt, um beispielsweise die Entwick- 
lung von thematischen Trends in fachwissenschaftlichen Publikationsorganen? 
oder auch den Status der Digital Humanities als Disziplin? zu untersuchen. 
Auch in der Digital History findet die Methode vermehrt Anwendung, etwa zur 
Identifikation und Analyse von Diskursen oder Publikationstrends in umfang- 
reichen historischen Quellenkorpora.* 

Wird ein genauerer Blick auf die konkret eingesetzten Verfahren geworfen, 
zeigt sich, dass die erstmals 2003 vorgestellte und seither weiterentwickelte La- 


1 Für eine allgemeine Einführung siehe David M. Blei, „Probabilistic Topic Models: Surveying 
a Suite of Algorithms that Offer a Solution to Managing Large Document Archives,“ Communi- 
cations of the ACM 55/4 (2012): 77-84, doi: 10.1145/2133806.2133826. 

2 Exemplarisch: David Mimno, „Computational Historiography: Data Mining in a Century of 
Classics Journals,“ ACM Journal on Computing and Cultural Heritage 5/1 (2012): 3:1-3:19, doi: 
10.1145/2160165.2160168. 

3 Jüngst: Jan Luhmann und Manuel Burghardt, „Digital Humanities — A Discipline in its Own 
Right? An Analysis of the Role and Position of Digital Humanities in the Academic Landscape,“ 
Journal of the Association for Information Science and Technology (2021): 1-24, doi: 10.1002/ 
asi.24533. 

4 Exemplarisch: Anselm Küsters und Elisa G. Moreno, „Mining ‚Die Zeit‘: A Structural Topic 
Model Analysis of Spain’s Image in the German Media 1946-2009,“ UPIER Working Paper 16 
(2019): 1-38; Estelle Bunout und Milan van Lange, „Nibbling at Text: Identifying Discourses on 
Europe in a Large Collection of Historical Newspapers Using Topic Modelling“ (21.06.2019), 
https://www.c2dh.uni.lu/thinkering/nibbling-text-identifying-discourses-europe-large-collec 
tion-historical-newspapers-using. Zugriff am 06.12.2021. 
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tent Dirichlet Allocation (LDA)? am häufigsten eingesetzt wird. Das liegt unter 
anderem daran, dass der Algorithmus durch gebrauchsfertige und gut doku- 
mentierte Tools wie Mallet® oder (informelle) Programmiertutorials und Soft- 
warebibliotheken hochverfiigbar und erschlossen ist. Zwar finden sich im er- 
weiterten Feld der Digital Humanities Untersuchungen, die auf die Herausforde- 
rungen hinweisen, die mit diesem hochgradig parametrisierenden Verfahren 
einhergehen und entsprechende Workflows fiir die produktive Integration in 
den Forschungsprozess vorschlagen,’ analoge Studien aus dezidiert geschichts- 
wissenschaftlicher Perspektive fehlen dagegen weitestgehend oder greifen le- 
diglich einzelne Aspekte kursorisch heraus.® 

Zur Schließung dieser Lücke möchte der vorliegende Artikel beitragen und 
die Potenziale und Grenzen der Adaptierbarkeit von Topic Modeling mit LDA 
aus historischer Perspektive beleuchten. Eine Auseinandersetzung mit den me- 
thodologisch-epistemologischen Auswirkungen sowie eine Sensibilisierung für 
die vielfältigen Konfigurationsmöglichkeiten des Algorithmus ist gerade dann 
besonders wichtig, wenn auf Standardeinstellungen oder gebrauchsfertige 
Werkzeuge zurückgegriffen wird. Insbesondere sind die Limitierungen für histo- 
rische Fragestellungen zu diskutieren, die vor allem darin bestehen, dass die 
Topic-Modellierung mit LDA die Temporalität der Daten nicht berücksichtigt. 
Zunächst wird ein knapper Blick auf den Entwicklungskontext und die dem Ver- 
fahren zugrundeliegenden Annahmen geworfen. Anschließend werden die Ei- 
genschaften der Topic-Modellierung mit LDA diskutiert und die Frage aufgewor- 
fen, was Topics eigentlich sind und was die Arbeit mit Topics für die digitale 
historische Forschungsarbeit bedeutet. Als Anwendungsbeispiel hierfür dienen 
exemplarische Befunde aus dem Topic Modeling der zwischen 1996 und Juni 


5 David M. Blei, Andrew Y. Ng und Michael I. Jordan, „Latent Dirichlet Allocation,“ Journal of 
Machine Learning Research 3 (2003): 993-1022. 

6 Andrew K. McCallum, „MALLET: A Machine Learning for Language Toolkit,“ 2002, http:// 
mallet.cs.umass.edu. Zugriff am 06.12.2021. 

7 Siehe unter anderem Inna Uglanova und Evelyn Gius, „The Order of Things: A Study on 
Topic Modeling of Literary Texts“, CEUR Workshop Proceedings 2723 (2020): 57-76, http:// 
ceur-ws.org/Vol-2723/long7.pdf. Zugriff am 06.12.2021. 

8 Aufschläge aus geschichtswissenschaftlicher Perspektive bieten: Peter Andorfer, „Turing 
Test für das Topic Modeling: Von Menschen und Maschinen erstellte inhaltliche Analysen 
der Korrespondenz von Leo von Thun-Hohenstein im Vergleich,“ Zeitschrift für digitale Geis- 
teswissenschaften 2 (2017), doi: 10.17175/2017_002; Martin Fechner und Andreas Weiß, „Einsatz 
von Topic Modeling in den Geschichtswissenschaften: Wissensbestände des 19. Jahrhunderts,“ 
Zeitschrift für digitale Geisteswissenschaften 2 (2017), doi: 10.17175/2017_005; Lino Wehrheim, 
„Economic History Goes Digital: Topic Modeling the Journal of Economic History,“ Cliometrica 
13 (2019): 83-125, hier: 89-96, doi: 10.1007/s11698-018-0171-7. 
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2019 auf dem Fachkommunikationsportal H-Soz-Kult? publizierten Tagungsbe- 
richte. !? 


2 Topic Modeling 


Wer sich erstmals mit der Methode Topic Modeling auseinandersetzt, wird mit 
hoher Wahrscheinlichkeit zunächst über LDA stolpern; in den Digital Huma- 
nities wird es häufig synonym für Topic Modeling gebraucht. Allerdings handelt 
es sich bei der Methode eigentlich um eine große Familie von Algorithmen." Sie 
werden seit den 2000er-Jahren in unterschiedlichsten Kontexten eingesetzt, um 
umfangreiche Textsammlungen über das sogenannte Clustern von kookkurren- 
ten Termen automatisiert zu beschreiben und zu klassifizieren. 

Die computergestützten Anfänge reichen zurück bis etwa in die 1980er Jah- 
re und entstammen dem Forschungsfeld der generativen probabilistischen Mo- 
delle. Hierbei wird angenommen, dass beobachtbare Variablen mit unbeobach- 
teten latenten, also nicht unmittelbar zu erfassenden Parametern auf eine be- 
stimmte Art und Weise interagieren, was im Grunde für die Generierung des 
Datensatzes verantwortlich ist.’ Folgen wir diesem methodischen Ansatz, ge- 
hen wir gewissermaßen davon aus, dass Autor:innen zur Textproduktion auf 
ein Set von Themen zurückgreifen, die sich über ein spezifisches Vokabular re- 
präsentieren lassen. Aus diesen themenspezifischen Vokabularen bedienen 
sich Autor:innen dann zu unterschiedlichen Anteilen. Mit der Topic-Modellie- 
rung sollen nun die verborgenen „Themenfelder“, die initial als Bausteine der 


9 H-Soz-Kult. Fachinformation und Kommunikation für die Geschichtswissenschaften, https:// 
www.hsozkult.de/. 

10 Die Modellierungsergebnisse stammen aus dem laufenden Promotionsvorhaben der Au- 
torin, Arbeitstitel: „Mining the Historian’s Web — Methodenkritische Reflexion quantitativer 
Verfahren zur Analyse genuin digitaler Quellen am Beispiel der historischen Fachkommunika- 
tion“. 

11 Dazu zählen unter anderem die Non-negative Matrix Factorization: Daniel D. Lee und H. 
Sebastian Seung, „Learning the Parts of Objects by Non-negative Matrix Factorization,“ Nature 
401 (1999): 788-791, doi: 10.1038/44565, oder auch das Structural Topic Modeling: Margaret E. 
Roberts et al., „The Structural Topic Model and Applied Social Science,“ Advances in Neural 
Information Processing Systems Workshop on Topic Models: Computation, Application, and Eva- 
luation (2013), und andere mehr. 

12 Blei, „Probabilistic Topic Models,“ 79-80; lke Vayansky und Sathish A.P. Kumar, „A Re- 
view of Topic Modeling Methods,“ Information Systems 94 (2020): 1-15, hier: 2, doi: 10.1016/j. 
is.2020.101582. 
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Textproduktion dienten, aus dem fertigen Text rekonstruiert werden.” Es ist da- 
bei ein möglicher Ansatz unter vielen, der dazu dient, die Komplexität umfang- 
reicher Datenmengen wie Textkollektionen zu reduzieren, um die potenziell re- 
levanten Informationen auszuheben.” 

Ursprünglich ging es darum, die Limitierungen von Vorgängerverfahren 
wie Term Frequency — Inverse Document Frequency, Latent Semantic Analysis/In- 
dexing oder probabilistic Latent Semantic Analysis/Indexing fiir die Beschrei- 
bung und Exploration unbekannter Datenmengen zu überwinden. Mit der Non- 
negative Matrix Factorization 1999 und LDA 2003 wurden dann Verfahren vorge- 
stellt, die es über die Identifikation statistisch signifikanter Wortgebrauchsmus- 
ter ermöglichten, die Dokumente einer Kollektion mittels eines unüberwachten 
Modellierungsverfahrens zusammenzufassen.” Die heutigen komplexen An- 
wendungsszenarien sowie die Besonderheiten historischer Fragestellungen 
spielten im Entwicklungsprozess allerdings keine Rolle und so scheinen die Er- 
kenntnisziele von Geistes- und Geschichtswissenschaftler:innen sich insofern 
von denen der Entwickler:innen entfernt zu haben, als es nicht allein um die 
Klassifikation im Sinne optimierter Suchheuristiken, sondern auch um die Prä- 
gung neuer Perspektiven auf die Quellen geht. 

Grundsätzlich ist die Integration von Methoden wie Topic Modeling in den 
Werkzeugkasten der Historiker:innen vielversprechend. Ein zentraler Vorteil, 
der generell für computationelle Methoden gilt, besteht in der systematischen 
Verarbeitung der Daten sowie der Skalierbarkeit des Forschungsdesigns. Wäh- 
rend in „analogen“ Forschungskontexten für gewöhnlich Stichproben und Fall- 
beispiele ausgewählt und exemplarisch untersucht werden, lassen sich digitale 
Methoden bei entsprechender Rechenleistung auf beliebig große Quellenkorpo- 
ra und Untersuchungszeiträume anwenden. Für Topic Modeling kommt hinzu, 
dass es sich um ein sogenanntes „unüberwachtes“ Verfahren handelt, das 
heißt, die Modellierungsergebnisse speisen sich allein aus den Inputdaten und 
beruhen nicht auf zuvor mit bestimmten Annahmen und Theorien definierten 


13 Blei, „Probabilistic Topic Models,“ 78, Anm. a auf 78; Blei, „Topic Modeling,“ Abs. 8, 12-13. 
14 Blei, Ng und Jordan, „Latent Dirichlet Allocation,“ 993-994; Wehrheim, „Economic Histo- 
ry,“ 93. 

15 Siehe überblickshaft zu dieser Entwicklung Blei, Ng und Jordan, „Latent Dirichlet Alloca- 
tion,“ 993-995, 1000-1002; Vayansky und Kumar, „A Review“, 2; Rubayyi Alghamdi und Kha- 
lid Alfalgi, „A Survey of Topic Modeling in Text Mining,“ International Journal of Advanced 
Computer Science and Applications 6/1 (2015): 147-153, hier: 147-149, doi: 10.14569/IJAC 
SA.2015.060121. 

16 Vgl. Benjamin M. Schmidt, „Words Alone: Dismantling Topic Models in the Humanities,“ 
Journal of Digital Humanities 2/1 (2012), http://journalofdigitalhumanities.org/2-1/words-alone- 
by-benjamin-m-schmidt/, Abs. 7, 9. Zugriff am 06.12.2021. 
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Kategorien.” Das eröffnet die Möglichkeit, umfangreiche historische Quellen- 
korpora heuristisch und explorativ zu erschließen und dabei potenziell unbe- 
kannte und verborgene thematische Muster zu entdecken, die Quellen referen- 
zieren, die sonst möglicherweise nicht berücksichtigt worden wären.'® Ein wei- 
terer Vorteil besteht in der Sprachunabhängigkeit der Verfahren, wo andere 
Methoden spezieller Sprachmodelle oder Lexika bedürften. Topic Modeling 
kann prinzipiell auf beliebige Quellenbestände angewendet werden, wenn- 
gleich die besonderen Eigenschaften bestimmter Sprachen, Textgattungen oder 
Sprachstufen mit ganz eigenen Herausforderungen einhergehen.!” 


3 Latent Dirichlet Allocation 


Wie eingangs angeführt, handelt es sich bei LDA bis dato um einen der popu- 
lärsten Topic-Modeling-Ansätze. Als probabilistischem Modell liegt ihm die An- 
nahme zugrunde, dass sich Dokumente aus einer latenten, also verborgenen 
thematischen Struktur zusammensetzen, die sich aus der jeweils spezifischen 
Kombination von Wörtern ablesen lässt. Da diese Kombination verborgen ist, 
muss sie aus der Häufigkeitsverteilung und Kookkurrenz der Wörter abgeleitet 
werden. Für diese Aufgabe wird die nach dem deutschen Mathematiker Peter 
Gustav Lejeune Dirichlet (1805-1859) benannte Dirichlet-Wahrscheinlichkeits- 
verteilung eingesetzt.?° Dabei ist LDA von zwei Annahmen motiviert: 1) Es gibt 
ein festes Set von Wortverwendungsmustern, das heißt Topics, die in den Doku- 
menten statistisch gehäuft gemeinsam vorkommen, und 2) jedes Dokument der 
Kollektion weist diese Topics zu unterschiedlichen Anteilen auf.” Dementspre- 
chend werden die Quellen mittels LDA zum einen als Set von Topics mitsamt 
ihrer proportionalen Anteile an den Dokumenten repräsentiert, was üblicher- 


17 Vgl. Andorfer, „Turing Test,“ Abs. 62; Bunout und van Lange, „Nibbling at Text,“ Abs. 11, 
13; Wehrheim, „Economic History,“ 94. 

18 Vgl. zu dieser Einschätzung Wehrheim, „Economic History,“ 94-95. 

19 Vgl. ibid., 92; für ein Verfahren, das beispielsweise den Herausforderungen der Mehrspra- 
chigkeit begegnet, siehe David Mimno et al., „Polylingual Topic Models,“ EMNLP 2009 (2009), 
880-889. 

20 Allen B. Riddell, „How to Read 22198 Journal Articles: Studying the History of German 
Studies with Topic Models,“ in Distant Readings: Topologies of German Culture in the Long Nine- 
teenth Century, hg. v. Matt Erlin und Lynne Tatlock (New York: Boydell & Brewer, 2014), 91-114, 
hier: 100. Die statistisch-mathematischen Grundlagen und Funktionsweisen des Algorithmus 
werden ausführlich beschrieben in Blei, Ng und Jordan, „Latent Dirichlet Allocation“; Blei, 
„Probabilistic Topic Models,“ 78-82. 

21 Blei, „Topic Modeling,“ Abs. 5. 
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weise als sogenannte Document-Term-Matrix formalisiert wird, also als Tabelle, 
die je Dokument die Topic-Gewichtung dokumentiert. Zum anderen wird als 
Output eine nach Relevanz geordnete Auflistung des Vokabulars je Topic gene- 
riert. 

Ermittelt werden diese Mixturen iiber einen randomisierten, generativen 
Prozess, der von einer Reihe von nutzerseitigen Einstellungen abhangt: Nach 
einer im Vorhinein festzulegenden Anzahl an Topics (zum Beispiel 80) weist 
der Algorithmus in einem ersten Schritt einerseits die einzelnen Wörter der Do- 
kumente zufällig den Topics zu und andererseits jedem Dokument eine zufälli- 
ge Topic-Mixtur. Es liegt nun in der Hand der Nutzer:innen festzulegen, in wie 
vielen Wiederholungen (Iterationen) durch den Vergleich der dokumentenba- 
sierten Kookkurrenzen die gebildeten Wortcluster algorithmisch optimiert wer- 
den sollen. Mit jeder weiteren Iteration wird die Wort-zu-Topic- und Topic-zu- 
Dokument-Verteilung verfeinert, wobei irgendwann ein praktikables Maximum 
erreicht wird, das es auszutarieren gilt.” 


Tab. 1: Exemplarischer Vergleich von zwei LDA-Implementierungen auf Basis der zwischen 
1996 und Juni 2019 auf H-Soz-Kult publizierten Tagungsberichte. 


Mallet-LDA Gensim-LDA 


digital projekt datum digitale edition digitali- digital digitalisierung projekt edition datum 
sierung online möglichkeit internet historisch technisch digital_edition online herausforder- 
stellen information neue datenbank tech- ung standard portal text tools dps format soft- 
nisch portal neu nutzen digital_humanities ware stellen möglichkeit werkzeug plattform 
datenbanken 


erinnerung geschichte vergangenheit erinne- gedenkstätte erinnerung ort lager opfer holo- 
rungskultur historisch gedächtnis erinnern caust vortrag denkmal gedenken geschichte 
holocaust umgang gedenken opfern ereignis jüdisch zeigen erinnern stellen zwangsarbeit 
zeitzeugen national auseinandersetzung nar- täter ehemalig häftling workshop historisch 
rativ erfahrung jahr öffentlich denkmal 


Dabei ist LDA allerdings nicht gleich LDA. Die Berechnung aller möglichen To- 
pic-Konstellationen im Verhältnis zum Gesamtkorpus ist mathematisch kom- 
plex und daher nur durch eine Annäherung zu erreichen.” Diesbezüglich lassen 
sich die Implementierungen von LDA in zwei Kategorien einteilen: 1) solche, 


22 Vgl. Blei, „Probabilistic Topic Models,“ 78-82; Wehrheim, „Economic History,“ 86-89. 
23 Blei, „Probabilistic Topic Models,“ 81. 
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die Variational-Bayes-Inference-Ansätze”* und 2) solche, die Gibbs sampling” 
nutzen.” Während hier ein ausführlicher Vergleich der statistischen Grundla- 
gen zu weit führen würde,” ist die Erwähnung wichtig, um darauf hinzuweisen, 
dass bei der Wahl des Modellierungsverfahrens nicht nur die Frage zu berück- 
sichtigen ist: „LDA - ja oder nein?“ sondern auch: „Welche konkrete Ausfüh- 
rung von LDA?“ In geisteswissenschaftlichen Anwendungskontexten ist etwa 
das Softwarepaket Mallet etabliert. Es bietet bei ausreichender Datenmenge und 
-qualität robuste und semantisch interpretierbare Ergebnisse und wurde auch 
für das hier verwendete Fallbeispiel verwendet (siehe die exemplarischen To- 
pics in Tabelle 3 im Anhang’). Die Pythonbibliothek Gensim bietet demgegen- 
über einen performanteren Algorithmus für sehr große Datenmengen.” Bei 
identischer Datenbasis unterscheiden sich die resultierenden Modelle deutlich. 
Grund dafür ist, dass Gensim Variational Bayes zur Ermittlung der Topic-Doku- 
ment- beziehungsweise Wort-Topic-Distributionen nutzt und Mallet demgegen- 
über Gibbs sampling. Zwar ermitteln die Algorithmen zum Teil einander ähneln- 
de Wortcluster (siehe Tabelle 1), allerdings würde ihre spezifische Wort-Zusam- 
menstellung abweichende Schwerpunkte der mit den Topics referenzierten 
Dokumente nahelegen. Derzeit fehlen Studien, die sich mit den epistemologi- 


24 Nach Blei, Ng und Jordan, „Latent Dirichlet Allocation,“ insbes. 1003-1007. 

25 Nach Thomas L. Griffiths und Mark Steyvers, „Finding Scientific Topics,“ Proceedings of the 
National Academy of Sciences of the United States of America 101, 1 (2004): 5228-5235, hier: 
insbes. 5229-5230, doi: 10.1073/pnas.0307752101. 

26 Blei, „Probabilistic Topic Models,“ 81; Jordan Boyd-Graber, David Mimno und David New- 
man, „Care and Feeding of Topic Models: Problems, Diagnostics, and Improvements,“ in Hand- 
book of Mixed Membership Models and Their Applications, hg. v. Edoardo M. Airoldi et al. (Boca 
Raton, Florida: CRC Press, 2014), 225-254, hier: 231. 

27 Siehe etwa Boyd-Graber, Mimno und Newman, „Care and Feeding,“ 231-233; sowie den 
systematischen Vergleich in Christine K. Mulunda et al., „Review of Trends in Topic Modeling 
Techniques, Tools, Inference Algorithms and Applications,“ ISCMI (2018): 28-37, hier: 33-34, 
doi: 10.1109/ISCMI.2018.8703231. 

28 Das in Auswahl in Tabelle 3 repräsentierte Topic-Modell besteht aus 80 Topics, die in 6 000 
Iterationen und mit einer Hyperparameter-Optimierung nach festgesetzten Intervallen gebildet 
wurden. Die Daten wurden mit freundlicher Genehmigung von H-Soz-Kult über ein Python- 
Skript aus der HTML-Struktur des Webauftritts ausgelesen und als CSV-Datei tabellarisch 
strukturiert abgespeichert. Insgesamt wurden für den Zeitraum 1996 bis Juni 2019 8040 Ta- 
gungsberichte heruntergeladen, davon bilden 6740 Tagungsberichte das mehrheitlich 
deutschsprachige Analysekorpus. Die Volltexte des Teilkorpus bestehen aus 12062497 Token 
(durchschnittlich 1789 Token pro Dokument). 

29 Zur Dokumentation: Gensim, models.ldamodel - Latent Dirichlet Allocation, https://radim 
rehurek.com/gensim/models/ldamodel.html. Zugriff am 06.12.2021. Zu Gensim siehe auch: Ra- 
dim Rehüfek und Petr Sojka, „Software Framework for Topic Modelling with Large Corpora,“ 
Proceedings of the LREC Workshop on New Challenges for NLP Frameworks (2010): 45-50. 
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schen und methodologischen Konsequenzen dieser Abweichungen und in der 
Folge unterschiedlichen Forschungsergebnissen auseinandersetzen. 

Unabhängig von der konkreten Implementierung handelt es sich bei LDA 
zudem anders als bisweilen zu lesen?’ um ein hochgradig parametrisierendes 
Verfahren. Auch wenn davon gesprochen wird, Topic-Modeling-Verfahren seien 
im Vergleich zu manuellen Kategorisierungen beispielsweise „objektiv“, da das 
Modellierungsergebnis allein auf Basis der eingespeisten Daten gebildet wird, ?! 
darf das nicht darüber hinwegtäuschen, dass nicht zuletzt die konkrete Anwen- 
dung eingebettet ist in einen komplexen Forschungsprozess. Dieser wird vom 
jeweiligen Wissenshorizont der Forschenden genauso geprägt wie von den ent- 
sprechenden forschungstheoretischen Annahmen des jeweiligen Vorhabens, 
was sich auf die Aufbereitung der Daten und die Wahl des finalen Modells aus- 
wirkt. Insbesondere letzteres ist mit einem zeitintensiven Evaluationsprozess 
verbunden, der die Ergebnisse unterschiedlicher Parametereinstellungen be- 
rücksichtigen und reflektieren muss und oftmals darauf zielt, das bestmöglich 
interpretierbare Modell zu finden.” Insofern Topic Modeling also von Menschen 
eingesetzt wird, die mit der Anwendung konkrete Forschungsfragen verbinden 
und die Daten entsprechend aufbereiten, ist auch die Topic-Modellierung nicht 
neutral, wohl aber systematisch. 

Während LDA in diesem Sinne zwar grundsätzlich auf unvorbereitete Text- 
daten angewendet werden kann, wird die Qualität des Ergebnisses durch einige 
strukturierende Vorverarbeitungsschritte (Preprocessing) aus dem Bereich des 
Natural Language Processing deutlich verbessert. Wie groß der Einfluss dieser 
Vorbereitung auf die Textbasis ist, zeigt die Gegenüberstellung der Wortanzahl 
des hier verwendeten Fallbeispiels vor- und nachher: Zu Beginn enthält das aus 
6740 Tagungsberichten bestehende Textkorpus etwa 12 062 497 Token, das sind 
durchschnittlich 1789 Token pro Dokument. Am Ende des Preprocessing waren 
es noch 5 751 616 Token zu durchschnittlich 853 pro Tagungsbericht, die zur Mo- 
dellierung der Topics herangezogen wurden.” 


30 Siehe Andorfer, „Turing Test,“ Abs. 14. 

31 So etwa in Wehrheim, „Economic History,“ 94. 

32 Anna Shadrova macht im Kontext der vielfältigen Parameter auf die Gefahr des Confirma- 
tion Bias beziehungsweise von Apophänie aufmerksam, siehe dies., „Topic Models Do Not Mo- 
del Topics: Epistemological Remarks and Steps Towards Best Practices,“ Journal of Data Mining 
and Digital Humanities (2021), doi: 10.46298/jdmdh.7595, 16-17. 

33 Das Preprocessing der mehrheitlich deutschsprachigen Tagungsberichte umfasste: 1) die 
Tokenisierung und Entfernung aller Satz- und numerischen Zeichen (Der Ausschluss numeri- 
scher Werte rechtfertigt sich durch den Umstand, dass in den Tagungsberichten Zahlen häufig 
in Bezug auf Veranstaltungen oder Anmerkungen genannt werden, sie also mehrheitlich kei- 
nen Beitrag zur thematischen Struktur der Beiträge leisten), 2) Lemmatisierung (inkl. manueller 
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Die Ermittlung der adäquaten Anzahl zu generierender Topics ist eine der 
offenkundigsten Herausforderungen, da sie der inhaltlichen Diversität des ent- 
sprechend aufbereiteten Korpus Rechnung tragen muss.” LDA bietet keine Au- 
tomatisierungsfunktion zur Ableitung der optimalen Topic-Anzahl aus den Da- 
ten.” Es gibt verschiedene mathematische Messgrößen wie die Topic Coherence, 
die den Evaluationsprozess durch automatisierte Vergleichswerte zur Bewer- 
tung der semantischen Qualität der Wortcluster unterstützen können.® Gleich- 
wohl bleibt es letztlich die Interpretationsleistung der Forschenden, die Granu- 
larität des Topic-Modells anhand der Fragestellung festzulegen. 

Zu wenig Beachtung finden in der geistes- und geschichtswissenschaftlichen 
Forschungsliteratur aktuell noch die sogenannten Hyperparameter Alpha und 
Beta, die Einfluss auf die Topic-Dokument- beziehungsweise Wort-Topic-Vertei- 
lungen haben.? Die Konfiguration der Hyperparameter, die bei der Nutzung (ge- 
brauchsfertiger) Werkzeuge oft durch Default-Werte abgenommen wird, beein- 
flusst das Verteilungsprofil des Modells deutlich: Grundsätzlich lässt sich zwi- 
schen symmetrischen und asymmetrischen Hyperparametern unterscheiden. Bei 
ersterem wird davon ausgegangen, dass die das distributionelle Profil beeinflus- 
senden Werte gleichverteilt sind, letzterer eröffnet dagegen die Möglichkeit, dass 
manche Topics bezogen auf das Gesamtkorpus stärker ausgeprägt sein können 
als andere. Analoges gilt für die Gewichtung der Terme je Topic.** 


Anpassung), 3) Part-of-Speech-Tagging (nur Adjektive, Verben und Nomen wurden dem Modell 
zugrunde gelegt), 4) Lowercasing, 5) Entfernung korpusspezifischer Terme, 6) Bildung von Bi- 
und Trigrammen. 

34 Eine niedrige Zahl von Topics führt zu tendenziell heterogenen Clustern, demgegenüber 
liefert eine sehr hohe Anzahl zum Teil redundante und spezifische Wortgruppen, die unter 
Umständen eine sinnvolle Interpretation erschweren, siehe dazu Christof Schöch, „Topic Mo- 
deling Genre: An Exploration of French Classical and Enlightenment Drama,“ Digital Huma- 
nities Quarterly 11/2 (2017), http://www.digitalhumanities.org/dhq/vol/11/2/000291/000291. 
html, Abs. 20, Anm. 7. Zugriff am 06.12.2021; Fechner und Weiß, „Topic Modeling,“ Abs. 26. 
35 Für einen algorithmischen Ansatz, die Topics aus den Daten abzuleiten, siehe Yee W. Teh, 
Michael I. Jordan und David M. Blei, „Hierarchical Dirichlet Processes,“ Journal of the American 
Statistical Association 101 (2006): 1566-1581, doi: 10.1198/016214506000000302. 

36 Siehe Daniel Maier et al., „Applying LDA Topic Modeling in Communication Research: 
Toward a Valid and Reliable Methodology“, Communication Methods and Measures 12, 2-3 
(2018): 93-118, hier: 102-103, doi: 10.1080/19312458.2018.1430754; Uglanova und Gius, „Order 
of Things,“ insb. 60. 

37 Siehe zur Relevanz Hanna M. Wallach, David Mimno und Andrew McCallum, „Rethinking 
LDA: Why Priors Matter,“ Advances in Neural Information Processing Systems 22 (NIPS 2009) 
(2009): 1973-1981. 

38 Vgl. Vayansky und Kumar, „A Review,“ 3; Wehrheim, „Economic History,“ 89; Schöch, 
„Topic Modeling,“ Abs. 20; Christof Schöch, „Topic Modeling with MALLET: Hyperparameter 
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Da LDA ein randomisiertes Verfahren ist, wird ihm gelegentlich eine man- 
gelnde Reproduzierbarkeit der Forschungsergebnisse vorgeworfen.” Eigentlich 
würde jeder Modellierungsdurchlauf bei einem zufälligen Startpunkt im Korpus 
mit der Bildung der Wort-Topic- und Topic-Dokumenten-Verteilungen begin- 
nen. Dadurch weichen die Ergebnisse verschiedener Durchläufe auch bei glei- 
chen Einstellungen immer voneinander ab. Während Zufallsfaktoren nicht 
sänzlich ausgeschlossen werden können, ist es doch in einigen Implementie- 
rungen wie Mallet möglich, die zufällige Initialisierung durch die Festlegung ei- 
nes konkreten Startwerts, dem sogenannten random seed, zu steuern.*° Damit 
können bei identischen Parametern die Modellierungsergebnisse exakt repli- 
ziert werden. Allerdings ist auch diese Einstellung nicht konsequenzenlos. 
Schon die Abweichung um eine Position, von 2764 auf 2765, ruft voneinander 
abweichende Modelle hervor (siehe Tabelle 2), wobei festzustellen ist, dass die 
Wortcluster einander ähneln und die Unterschiede sich vor allem auf Ebene des 
Wortrangs ergeben.“ 


Tab. 2: Exemplarischer Vergleich von zwei Topics nach Modellierungsdurchläufen mit zwei ver- 
schiedenen random seeds. 


Seed 2764 2765 

Topic erinnerung geschichte vergangen- erinnerung geschichte vergangenheit 
heit erinnerungskultur historisch historisch erinnerungskultur holo- 
gedächtnis erinnern holocaust um- caust erinnern opfern umgang 
gang gedenken opfern ereignis gedächtnis erfahrung gedenkstätte 
zeitzeugen national auseinander- gedenken thema ereignis öffentlich 
setzung narrativ erfahrung jahr jahr auseinandersetzung ort zeit- 
öffentlich denkmal zeugen 


Neben den Konfigurationsoptionen limitieren einige im Algorithmus inhärente 
Eigenschaften den Aussagewert der Modellierungsergebnisse. Eine das Ergebnis 
stark beeinflussende Annahme ist beispielsweise die sogenannte bag-of-words- 
Annahme, nach der die Reihenfolge der lexikalischen Einheiten für die Ermitt- 
lung der semantischen Strukturen keine Rolle spielt. Auch berücksichtigt der 


Optimization,“ The Dragonfly’s Gaze. Computational Analysis of Literary Texts (14.11.2016), 
https://dragonfly.hypotheses.org/1051. Zugriff am 06.12.2021. 

39 So etwa in Bunout und Lange, „Nibbling at Text,“ Abs. 16-18. 

40 Der in dieser Arbeit verwendete Seed „2764“ wurde durch einen Zufallsgenerator ermittelt, 
um eine subjektive Beeinflussung auszuschließen, was selbst wiederum eine methodisch rele- 
vante Entscheidung ist. 

41 Zu einer vergleichbaren Erkenntnis kommt Schöch, „Topic Modeling,“ Abs. 14. 

42 Blei, Ng und Jordan, „Latent Dirichlet Allocation,“ 994. 
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Algorithmus nicht den Aufbau einer Dokumentensammlung. Die jeweiligen 
Texte sind für den Algorithmus austauschbar.” Dies ist insbesondere bei histo- 
risch gewachsenen Korpora ein Manko. Denn das Topic-Modell mit LDA be- 
inhaltet keine zeitliche Dimension oder eine äquivalente natürliche Ordnung; 
es ist statisch.** In der Praxis werden die erzeugten Modelle daher üblicherwei- 
se — so auch hier - um weitere Metadaten wie das Erscheinungsdatum eines 
Textes ergänzt.” Dadurch lässt sich zwar ermitteln, wie die Wahrscheinlich- 
keitswerte im zeitlichen Verlauf variieren, nicht aber wie sich dies auf der Ebene 
der lexikalischen Einheiten widerspiegelt. Zudem wurde dieser Algorithmus an- 
hand normierter wissenschaftlicher Texte entwickelt und getestet.‘° Bei literari- 
schen oder historischen Quellen, die oftmals einen heterogenen Sprachge- 
brauch und eine nicht-normierte Rechtschreibung und Stilistik aufweisen, kann 
sich dieser Umstand entsprechend im Modellierungsergebnis abzeichnen und 
besondere Vorverarbeitungsschritte notwendig machen.” 


4 Topics sind keine Themen 


Abschließend bleibt noch die Frage zu diskutieren, wie der Begriff „Topic“ im 
Kontext von LDA verstanden wird und was sein Wesen für die historische Er- 
kenntnisproduktion bedeutet. Die Anwendung von Topic Modeling in geistes- 
und geschichtswissenschaftlichen Forschungskontexten ist für gewöhnlich 
durch zwei Annahmen motiviert: erstens, dass die Topics kohärent sind und 
folglich die einzelnen, einem Topic zugewiesenen Begriffe etwas gemeinsam 
haben; zweitens, dass ein in zwei Dokumenten in etwa gleichwertig vorkom- 
mendes Topic in beiden Kontexten dieselbe Bedeutung trägt.“ Sind diese An- 
nahmen zutreffend und was genau ist ein Topic? Es ist statistisch-mathematisch 


43 Ibid.; Blei, „Probabilistic Topic Models,“ 82. 

44 Vgl. Riddell, „How to Read,“ 108. 

45 Exemplarisch ibid., 102-107; Wehrheim, „Economic History,“ 100; Jeri Wieringa setzte sich 
in einer Blogserie mit den gebräuchlichen Berechnungsweisen zur Topic-Modellierung anhand 
der Zeitachse auseinander, siehe dazu den Auftaktpost: dies., „Ways to Compute Topics over 
Time: Part 1,“ From Data to Scholarship. Musings on History, Religion, and Computers 
(21.06.2017), http://jeriwieringa.com/2017/06/21/Calculating-and-Visualizing-Topic-Significan 
ce-over-Time-Part-1/. Zugriff am 06.12.2021. 

46 Siehe Blei, Ng und Jordan, „Latent Dirichlet Allocation,“ 1007-1014. 

47 Siehe zur Relevanz der Vorverabeitung literarischer Korpora Uglanova und Gius, „Order of 
Things“. 

48 Schmidt, „Words Alone,“ Abs. 3. 
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formuliert zunächst nicht mehr oder weniger als eine Wahrscheinlichkeitsver- 
teilung über die gesamte Textkollektion, die beschreibt, welche Wörter eines fi- 
xen Gesamtvokabulars gehäuft gemeinsam vorkommen. Aus diesen gemeinsa- 
men Häufigkeiten ergeben sich dann Wortgruppen, die zu unterschiedlichen 
Anteilen in den einzelnen Dokumenten der Textsammlung vertreten sind. Der 
Begriff „Topic“ vermag damit zwar Assoziationen an beispielsweise die Topik 
oder „Topoi“ zu wecken, jedoch sind damit keine epistemologischen Behaup- 
tungen über die Wahrscheinlichkeiten des gemeinsamen Vorkommens hinaus 
verbunden.” Werden Topics allerdings, wie in den Geisteswissenschaften üb- 
lich, als semantische Felder”? oder Diskurse?! interpretiert, dann geschieht das 
auf Grundlage des Konzepts der distributionellen Semantik, die zahlreichen Me- 
thoden aus dem Bereich der Computerlinguistik zugrunde liegt.” 

Gemäß der distributionellen Semantik ergibt sich die Bedeutung lexikali- 
scher Einheiten aus ihrer Vorkommenshäufigkeit und zwar insbesondere aus 
ihrem gemeinsamen Vorkommen mit anderen lexikalischen Einheiten in einem 
spezifischen Kontext. Das heißt, dass Wörter, die beispielsweise im selben Do- 
kument auftreten, dazu tendieren, zum selben Themenfeld zu gehören. Diese 
Häufigkeitsbeziehungen zwischen Wörtern werden über Koordinaten in einem 
Raum numerisch repräsentiert, dem vector space.” Auf diese Weise werden tex- 
tuelle Daten für den ‚semantisch blinden Computer“ auf einer Bedeutungsebe- 
ne operationalisier- und vergleichbar. Insofern wird angenommen, dass sich 
auch historische Forschungsthemen durch ein spezifisches Set von Begriffen 
ausdrücken, die sich in den einzelnen Quellen niederschlagen und über die au- 
tomatisierte Mustererkennung extrahiert werden können. 

Welche Typen von Topics mit der Modellierung möglich sind, veranschau- 
licht Tabelle 3 im Anhang, die exemplarisch 15 von 80 Topics aus einem Modell 
der zwischen 1996 und Juni 2019 auf dem Fachinformationsportal H-Soz-Kult 
veröffentlichten Tagungsberichte auflistet. Es ergeben sich im Wesentlichen 
drei verschiedene Topic-Typen, die unterschiedliche Eigenschaften der Textkol- 
lektion repräsentieren: 


49 Blei, Ng und Jordan, „Latent Dirichlet Allocation,“ Anm. 1 auf 996. 

50 So z.B. Andrew Piper, Enumerations: Data and Literary Study (Chicago und London: The 
University of Chicago Press, 2018): 67; Bunout und Lange, „Nibbling at Text,“ Abs. 16. 

51 Fechner und Weiß, „Topic Modeling,“ Abs. 3, 7. 

52 Vgl. Piper, Enumerations, 13; Schöch, „Topic Modeling,“ Abs. 14. 

53 Blei, „Topic Modeling,“ Abs. 9; Piper, Enumerations, 13-14. 

54 Nach Silke Schwandt, „Digitale Methoden für die Historische Semantik: Auf den Spuren 
von Begriffen in digitalen Korpora,“ Geschichte und Gesellschaft 44 (2018): 107-134, hier: 
108, 133. 
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1. Metatopics bezeichnen solche Wortcluster, die vor allem etwas über die 
Textart und ihre formale Gestaltung aussagen. Sie enthalten sprachliche 
Elemente, die das Korpus als Ganzes miteinander verbinden, weswegen sie 
in der Regel hohe Wahrscheinlichkeitswerte aufweisen. So enthält Topic 46 
der Tagungsberichte Terme, die im Umfeld der Tagungs- und Vortragspra- 
xis Verwendung finden. Es spiegelt folglich stilistische und gattungsspezifi- 
sche Eigenschaften der Quelle wider. Zwar sind Metatopics für die inhaltli- 
che Auswertung zu vernachlässigen, hinsichtlich der formalen Einordnung 
des Untersuchungsgegenstands vermögen sie indes interessante Einblicke 
zu liefern.” 

2. Noisy Topics sind gekennzeichnet durch informationelles Rauschen. Da ein 
wesentlicher Vorzug der Topic-Modellierung darin besteht, die Regelmäßig- 
keiten in der sprachlichen Struktur textueller Daten aufzudecken,” bilden 
sich auch Cluster heraus, die bestimmte Phänomene auf der Textoberfläche 
und weniger semantische Zusammenhänge repräsentieren. Im Falle von H- 
Soz-Kult clustern zum Beispiel Dokumente aus der Frühphase, in denen 
aufgrund der Textkodierung keine Umlaute verwendet wurden (Topic 19) 
oder auch solche, die fremdsprachige Partikel enthalten und damit sprach- 
raumspezifische Topics generieren (Topic 67). Solche Cluster zeigen die 
sprachliche Heterogenität der Daten auf und können Ansatz für weitere Be- 
reinigungsschritte sein. 

3. Semantische Wortfelder sind die Art von Topics, die wir uns von Topic-Mo- 
dellen erhoffen. Sie repräsentieren idealerweise kohärente Themenfelder, 
die sich sinnvoll interpretieren und in den Dokumenten nachweisen lassen. 
Für die Tagungsberichte konnten 71 solcher Cluster generiert werden. 


Die unterschiedlichen Clustertypen verdeutlichen, dass diese Methode nicht au- 
tomatisch Themen aus den Textdaten extrahiert, sondern in erster Linie statis- 
tisch auffällige Wortverwendungsmuster. Diese können abhängig von der Da- 
tengrundlage wie Themen oder Diskurse, aber auch als literarische Motive inter- 
pretiert werden, dürfen aber nicht darüber hinwegtäuschen, dass zugleich 


55 Auch in anderen Forschungsprojekten sind Metatopics, die in Bezug auf die Fragestellung 
keine semantische Qualität haben, regelmäßig dominant vertreten, siehe etwa Schöch, „Topic 
Modeling,“ Abs. 23. Oft finden sie zugunsten einer Konzentration auf semantische Cluster indes 
keine Erwähnung. 

56 Uglanova und Gius, „Order of Things,“ 71-72. 
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andere, strukturelle und stilistische sowie anderweitige Sprachphänomene 
möglich sind.” 

Schauen wir uns eines der vermeintlich semantisch kohärenten Topics ge- 
nauer an: Topic 40. Die Top-20 Wörter des Topics verweisen in ihrer Zusammen- 
setzung auf das Themenfeld „Digitalität“ (siehe Abbildung 1 sowie Tabelle 3 im 
Anhang). Wie bereits erläutert, wurden dem Modell entsprechende Metadaten 
hinzugefügt, um eine Auswertung des zeitlichen Verlaufs zu ermöglichen. So- 
wohl anhand der durchschnittlichen jährlichen Topic-Verteilung als auch der 
Entwicklung der Beitragszahlen (siehe Abbildung 1) zeigt sich, dass nach einem 
frühen Peak 2003 die Auseinandersetzung mit Themen rund um die Digitalität 
im Verhältnis zu anderen Topics im Tagungsgeschehen zuzunehmen scheint. 


Anzahl der Tagungsberichte pro Jahr mit Topic 40 


30 
—— Topic 40: digital projekt datum 
Be Topic 40 
Eon datenbanken 
3 digitale 
515 neu 
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= neue internet 
5 è nutzen 
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SITSESSISS SSS SS HHS PS HSS OSHS möglichkeit, 
0.030 igital_humanities 
—— Topic 40: digital projekt datum d i g i t a l i S i erun g 
2 information 
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Abb. 1: Entwicklung von Topic 40 in den Tagungsberichten anhand der jährlichen Beitragsan- 
zahl (Schwellenwert: 15%) und durchschnittlichen jährlichen Verteilung (Schwellenwert: 5 %). 


57 Siehe auch die Ausdifferenzierung von potenziellen Störquellen in Topics in Boyd-Graber, 
Mimno und Newman, „Care and Feeding,“ 234-237. 


270 —— Melanie Althage 


Anhand des Wortclusters lässt sich erahnen, dass Projekte, Editionen, Daten- 
banken, aber auch das Internet allgemein sowie Portale den Diskurs rundum 
die Digitalität auf Tagungen bestimmen, weniger im Vergleich dagegen die Digi- 
tal Humanities. Aber wir erinnern uns: Topics bestehen aus Wörtern mit einer 
festen, unveränderlichen Wahrscheinlichkeit, das heißt, die lexikalische Kom- 
position der Topics ist immer gleich, unabhängig davon, ob es einem Dokument 
aus dem Jahr 2003 oder 2018 zugewiesen wurde. Die diachrone Analyse der Ver- 
teilung von Topic 40 ist weniger eine Untersuchung eines distinkten Themas 
als vielmehr eine der sich verändernden Ausprägung der Wahrscheinlichkeits- 
werte der Dokument-Topic-Zuweisungen, also, ob mehr oder weniger bezie- 
hungsweise dominantere oder rezessivere Terme eines Clusters in den Doku- 
menten gemeinsam auftreten. Über die konkrete Zusammensetzung dieser Ter- 
me für den jeweiligen Zeitschnitt und die Dokumente ist damit allerdings nichts 
gesagt. Annahmen über die Bedeutung und Kohärenz eines Topics auf Basis der 
Top-Wörter allein sind daher kritisch und bergen die Gefahr, sich fehlleiten zu 
lassen.°® Eine erste Durchsicht der gruppierten Dokumente offenbart etwa, dass 
die inhaltliche Spannbreite bei den Tagungsberichten sehr weitgefächert ist 
und Themen umfasst wie den Stellenwert des Internet für die historische Zunft, 
die Etablierung von Infrastrukturprojekten und Datenbanken, die Öffnung des 
Editions- und Zeitschriftenwesens für neue Medien und Technologien sowie 
Fragen nach den Möglichkeiten eines barrierefreieren Zugangs zu Institutionen 
des kulturellen Erbes beinhaltet, aber auch Auseinandersetzungen mit der Digi- 
talisierung an sich bis hin zu den Digital Humanities und schließlich der Digital 
History. Diese in den Dokumenten offenbar werdende Heterogenität wird über 
statische Topic-Modelle nicht sichtbar. 

Hinzu kommt, dass prinzipiell alle Dokumente und alle Wörter eines Kor- 
pus zu jeder Zeit mit jedem Topic verknüpft sind oder, um es mit den Worten 
Andrew Pipers zu sagen: „Each topic contains within it the seeds of every other 
topic.“ Das Gewicht der Topics für die einzelnen Dokumente variiert indes ent- 
sprechend des spezifischen Wortgebrauchs in den einzelnen Dokumenten be- 
trächtlich, wobei die meisten Werte gegen O Prozent tendieren. Für eine Zeitrei- 
henanalyse sind die Modellierungsergebnisse, die ohnehin schon eine Komple- 
xitätsreduktion der Forschungsressource darstellen, daher über Schwellenwerte 
und Ähnliches zu normalisieren, was die relativen Verteilungsergebnisse noch 
einmal modifiziert. In der Regel lassen sich Topics überhaupt erst ab etwa 5 Pro- 
zent begrifflich in den Dokumenten nachweisen, ab 15 Prozent schlagen sie sich 


58 Vgl. Schmidt, „Words Alone,“ Abs. 5-6. 
59 Piper, Enumerations, 74. 
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dann auch inhaltlich nieder.©° Je nach gesetztem Schwellenwert und Normali- 
sierungsworkflow unterscheidet sich folglich die Aussagekraft der probabilisti- 
schen Verteilungen. Was tatsächlich untersucht wird, ist der musterhafte 
Sprachgebrauch, der erst ab einer gewissen Dichte thematische Rückschlüsse 
erlaubt. 

Doch auch die Beurteilung dieser Verteilungen selbst, die ja nicht selten Ba- 
sis diachroner Analysen sind, ist schwierig. Dass die Topic-Gewichtung ab- oder 
zunimmt, muss noch nicht bedeuten, dass das Topic an sich an Relevanz ver- 
liert oder gewinnt. Topics werden üblicherweise auf Basis der ersten zehn bis 
30 Wörter gelabelt, um sie handhabbar zu machen. Hier wurde mit „Digitalität“ 
ein recht allgemeines Etikett gewählt unter das sich Vieles subsumieren lässt. 
Die Distributionen beschränken sich für die Klassifikation aber nicht nur auf 
diese Top-Wörter und so kann es sein, dass ein Dokument mit einer Topic-Dis- 
tribution von 30 Prozent‘! ebenso das Themenfeld „Digitalität“ abdeckt wie ei- 
nes mit 51 Prozent.“ Der Unterschied ergibt sich vor allem aus dem Gewicht der 
Wörter für das Topic. Beim manuellen Klassifizieren wäre eine solche qualitati- 
ve Unterscheidung wahrscheinlich gar nicht vorgekommen, entscheidend wäre, 
dass überhaupt eine Auseinandersetzung mit „Digitalität“ stattfindet. Wieder- 
um zeigt sich, dass die inhaltlichen Schwerpunkte von Dokumenten mit glei- 
cher Distribution kontextabhängig deutlich variieren können. Insofern ist es 
fraglich, was eine Zeitreihenanalyse der prozentualen Anteile im Rahmen einer 
Untersuchung thematischer Konjunkturen aussagt, weswegen hier zusätzlich 
die Entwicklung der absoluten Beitragszahlen mit Topic 40 angeführt wurde 
(siehe Abbildung 1). 

Ohne eine Berücksichtigung der tatsächlichen Inhalte der Dokumente 
durch Close Reading ist eine diachrone Analyse von Topics allein auf Basis der 
Top-Wörter und arbiträrer Schwellenwerte in ihrem Aussagewert begrenzt, 
auch, weil das Verfahren ursprünglich nicht darauf ausgerichtet war. Entspre- 


60 Andrew Piper stellt in Bezug auf seine Analyse von Romanen des 18. bis frühen 20. Jahr- 
hunderts fest, dass ein Topic erst ab einem Schwellenwert von 20 Prozent tatsächlich inhaltlich 
im Dokument festgestellt werden könne, siehe ibid., 76-77. Wehrheim, „Economic History,“ 112 
erfasst Topics dagegen als „substantial“ ab einem Wert von 10 Prozent. Das richtige Maß ist 
also stets in Abhängigkeit von der jeweiligen Quelle zu treffen. Hier wurde für die Normalisie- 
rung ein Schwellenwert von 5 Prozent angesetzt, um Veränderungen im Verteilungsprofil ab- 
bilden zu können. 

61 https://www.hsozkult.de/conferencereport/id/tagungsberichte-4510. Zugriff am 06.12.2021. 
62 https://www.hsozkult.de/conferencereport/id/tagungsberichte-6455. Zugriff am 06.12.2021. 
63 Siehe etwa die Tagungsberichte https://www.hsozkult.de/conferencereport/id/tagungsbe 
richte-189 und https://www.hsozkult.de/conferencereport/id/tagungsberichte-193 mit einer 
Distribution von jeweils 38 Prozent. Zugriff jeweils am 06.12.2021 
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chend des urspriinglichen Entwicklungsziels ist es dagegen sehr gut als explo- 
ratives, heuristisches Mittel geeignet, um in der Vielzahl von Dokumenten po- 
tenziell fiir eine Fragestellung relevante Quellen zu identifizieren, die dann 
aber einer detaillierteren Analyse bedürfen. Für Forschungsansatze, die Topic 
Modeling fiir temporale Untersuchungen anwenden möchten, erscheint es viel- 
versprechend, Evolutionsmodelle wie Dynamic Topic Modeling mit Blick auf 
ihre Adaptierbarkeit fiir geschichtswissenschaftliche Forschungsvorhaben um- 
fangreicher zu erforschen.™ Auf diese Weise wäre es möglich, die semantischen 
Wortfelder selbst zu historisieren und zu untersuchen, wie sich der mit einem 
Themenfeld einhergehende spezifische Sprachgebrauch wandelt. Aber auch ge- 
nerell sind die epistemologischen Dimensionen von Topics und ihren probabi- 
listischen Verteilungswerten systematischer zu erforschen wie es Anna Shadro- 
va jüngst aus linguistischer Perspektive kritisch getan hat.© 


5 Fazit 


Algorithmen wie LDA gewähren einen spezifischen und neuartigen Blickwinkel 
auf historische Quellen und stellen eine vielversprechende Erweiterung für den 
Werkzeugkasten der Historiker:innen dar. Besonders geeignet ist die Topic-Mo- 
dellierung mit LDA etwa für heuristische Zwecke, um im Vorfeld einer detaillier- 
ten Analyse oder in Kombination mit Close-Reading-Ansätzen erste systemati- 
sche und sprachunabhängige Einsichten in umfangreiche Quellenbestände zu 
erhalten. Allerdings geht das Verfahren mit einigen Herausforderungen einher: 
So hängen die möglichen Forschungsergebnisse unmittelbar von der Vorberei- 
tung der Textdaten sowie der Konfiguration der Modellparameter ab und sind 
mit einem komplexen Evaluationsprozess hinsichtlich der Qualität, Reprodu- 
zierbarkeit und Zuverlässigkeit des Modells verbunden. Für geschichtswissen- 
schaftliche Fragestellungen besonders relevant ist zudem der Umstand, dass im 
Modellierungsprozess selbst beispielsweise die Kontext- und Zeitgebundenheit 
der Quellen keine Berücksichtigung findet. Schließlich erweist sich die doku- 
mentenunabhängige Interpretation der Topics an sich als schwieriges Unterfan- 
gen. Die retrospektive Gleichsetzung von Topics mit kohärenten Themen ver- 


64 Siehe David M. Blei und John D. Lafferty, „Dynamic Topic Models,“ Proceedings of the 23rd 
International Conference on Machine Learning (2006): 113-120, doi: 10.1145/1143844.1143859, 
sowie in Anwendung etwa Jo Guldi, „Parliament’s Debates about Infrastructure: An Exercise 
in Using Dynamic Topic Models to Synthesize Historical Change,“ Technology and Culture 60/1 
(2019): 1-33, doi: 10.1353/tech.2019.0000. 

65 Shadrova, „Topic Models.“ 
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schleiert die vielfältige Gestalt der Wortcluster, die zwar semantische Beziehun- 
gen abbilden, je nach probabilistischer Ausprägung aber auch zu Fehleinschät- 
zungen über die Inhalte und ihre Entwicklung führen kann oder andere Phäno- 
mene des Wortgebrauchs repräsentiert. 

Obgleich sich die Topic-Modellierung mit LDA aufgrund der verfügbaren 
Softwaretools und -bibliotheken grundsätzlich anbietet, ist stets im Einzelfall 
für die jeweilige Quellengrundlage und Fragestellung die Eignung zu prüfen. 
Tiefergehend zu erforschen ist, bis zu welchem Grad sich geschichtswissen- 
schaftliche Forschungsthemen und insbesondere -perspektiven anhand eines 
spezifischen Wortgebrauchs nachweisen und letztlich automatisiert untersu- 
chen lassen. Es erscheint empfehlenswert, in den deutschsprachigen Geistes- 
und Geschichtswissenschaften über LDA als Standard hinauszugehen und die 
internationalen und disziplinübergreifenden Entwicklungen stärker aufzuneh- 
men und auch in Software-Umgebungen umzusetzen.°° Denn die Wahl des kon- 
kreten Modellierungsverfahrens entscheidet darüber, welche Aussagen sich 
über die sprachliche Struktur einer Dokumentensammlung treffen lassen. 
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Anhang 


Tab. 3: Topics in den auf H-Soz-Kult zwischen 1996 und 2019 veröffentlichten Tagungsberich- 
ten (Auswahl). Topics, die nicht zu den semantischen Wortfeldern zählen, sind kursiv hervor- 
gehoben. 


Nr. 


10 


Die 20 für das Topic wahrscheinlichsten Wörter 

erinnerung geschichte vergangenheit erinnerungskultur historisch ge- 
dächtnis erinnern holocaust umgang gedenken opfern ereignis zeitzeugen 
national auseinandersetzung narrativ erfahrung jahr öffentlich denkmal 


Verteilung 
8,1% 


13 


französisch frankreich paris französische de deutsch deutschen_franzö- 
sisch le beitrag deutschland_frankreich pariser la deutschland les bezie- 
hung deutschen_französische franzose untersuchen jean land 


2,5% 


19 


fuer waehrend schliesslich ueber universitaet koennen zj verhaeltnis oef- 
fentlichkeit haetten fuehrte preussen beitraege berlin grossen bevoelke- 
rung wuerden koenne referat zeuge_jehovas 


1,3% 


22 


antik römisch rom griechisch archäologisch zeit archäologie spätantike 
römische quelle stadt athen kaiser chr lassen antike jahrhundert_chr rö- 
mer spätantiken jh_chr 


4,6% 


34 


deutsch holocaust jude bevölkerung opfern deutsche besatzung wider- 
stand ss deutschland zweite_weltkrieg sowjetisch besetzen kollaboration 
konferenz wehrmacht verbrechen kriegen ghetto nationalsozialistischen 


3,5% 


35 


jüdisch jude jüdische antisemitismus israel judentum antisemitisch 
deutsch geschichte deutschland christlich jüdisch_gemeinde leben israe- 
lisch religiös deutschen_jüdisch palästina gemeinde holocaust antisemi- 
tische 


2,8% 


40 


digital projekt datum digitale edition digitalisierung online möglichkeit in- 
ternet historisch stellen information neue datenbank technisch portal neu 
nutzen digital_humanities datenbanken 


4,5% 


43 


nationalsozialismus ns deutsch nationalsozialistischen politisch hitler 
widerstand volksgemeinschaft nationalsozialist nsdap dritte_reich wei- 
marer_republik ns_zeit ns_regime kontinuität nachkriegszeit deutsche 
nationalsozialistische forschung jugendbewegung 


4,7% 


46 


vortrag stellen zeigen beispiel tagung jahrhundert frage beitrag verschie- 
den bedeutung untersuchen unterschiedlich deutlich stehen gehen sekti- 
on widmen entwicklung rollen aspekt 


82,4% 


49 


text schrift texten jahrhundert autor handschrift werken antik buch edi- 
tion de rezeption mittelalterlich inhalt wissen übersetzung werk quelle 
buchen sprache 


5,7% 


50 


religiös gott mittelalterlich mittelalter heilige jahrhundert christlich ritual 
christus text kirche tod tradition göttlich religion heilig theologisch per- 
son christliche liturgie 


5,0% 
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Tab. 3 (fortgesetzt) 


Nr. Die 20 für das Topic wahrscheinlichsten Wörter Verteilung 


52 europäisch europa national international europäische land deutschland 7,9% 
deutsch transnationalen transfer eu internationale vergleichen transnatio- 
nale konzept ebene frankreich staat integration stark 


62 identität kultur politisch kulturell jahrhundert national nation gesellschaft 10,8% 
sprache deutsch diskurs gruppe kulturelle mythos konstruktion ethnisch 
religiös beispiel vorstellung geschichte 


67 of_the and_the university_of konferenz usa university world london ger- 2,5% 
man european modern amerikanisch social international history europe 
studies john national historical 


76 global kolonial china europäisch afrika welt japan indien global- 4,9% 
geschichte chinesisch globalisierung indisch kolonie kolonialismus euro- 
pa sklaverei koloniale japanisch afrikanisch missionar 
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Abstract: Since 2018, the innovative teaching projects „CA 2.x — Christian Ar- 
chaeology in the inverted classroom“ and ,,Virtual Excursions“ have been de- 
veloped at FAU’s chair of Early Christian Archaeology. Their aim is to improve 
teaching and to increase the attractiveness of the subject. On the basis of a tar- 
get group analysis, concepts have been developed that focus on the students of 
»Generation Z“ and take their needs and reception habits seriously. While 
videos on typical research topics were produced as part of the inverted class- 
room project, 360° images and videos of important monuments were created for 
the virtual excursions. Both projects follow a modular structure. This not only 
allows us to use the material in almost any course type, it can also be updated 
and expanded with little effort. 


Keywords: Early Christian Archaeology, research in teaching and learning, in- 
verted classroom, virtual reality, Generation Z, teaching video 


Zusammenfassung: Seit 2018 werden in der Christlichen Archäologie in Erlan- 
gen die innovativen Lehrprojekte „CA 2.x - Christliche Archäologie im Inverted 
Classroom“ und „Virtual Excursions“ entwickelt. Sie haben zum Ziel, die Lehre 
zu verbessern und die Studienattraktivitat des Faches zu steigern. Auf der Basis 
einer eigens zusammengestellten Zielgruppenanalyse sind Konzepte erarbeitet 
worden, die die Studierenden der ,,Generation Z“ fokussieren und ihre Bedarfe 
und Rezeptionsgewohnheiten ernst nehmen. Während im Rahmen des Inverted 
Classroom-Projektes unter anderem Videos zu Forschungsthemen des Faches 
gedreht worden sind, sind für die virtuellen Exkursionen 360°-Aufnahmen be- 
deutender Monumente entstanden. Beide Projekte sind in einer modularen 
Struktur erstellt worden. Diese ermöglicht es nicht nur, das Material in nahezu 
allen Lehrveranstaltungen zu verwenden, es kann auch mit geringem Arbeits- 
aufwand aktualisiert und erweitert werden. 


Schlagwörter: Christliche Archäologie; Lehr-Lern-Forschung; Inverted Class- 
room; Virtual Reality; Generation Z; Lehrvideo 


3 Open Access. © 2022 Lara Mührenberg, Ute Verstegen, published by De Gruyter. [EVER] Dieses Werk 
ist lizensiert unter einer Creative Commons Namensnennung 4.0 International Lizenz. 
https://doi.org/10.1515/9783110757101-015 


282 —— Lara Mührenberg, Ute Verstegen 


Wie kann ein archäologischer Einführungskurs für Studierende strukturiert 
sein, die keinen Computer mehr besitzen, Texte nur am Smartphone lesen, 
Frontalunterricht wünschen und die Dozierenden filmen wollen, um keine Mit- 
schrift anfertigen zu müssen? Seit etwa drei Jahren strömt die neue Generation 
Z! an die Hochschulen und fordert die Lehrenden heraus. Vor uns stehen die 
ersten echten digital natives,” die eine rein analoge Welt nicht mehr kennen und 
virtuelle Realitäten als Teil ihrer Wirklichkeit erleben. Studien attestieren dieser 
Generation zudem eine ausgeprägte Konsumhaltung. Schon vor der Covid19- 
Pandemie, die zu einem starken Anstieg digitaler Lehrangebote an den Univer- 
sitäten geführt hat, hat sich die Frage gestellt: Was tun? 

Seit 2018 reagieren unterschiedliche Projekte am Lehrstuhl für Christliche 
Archäologie der Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU) auf 
diese Frage. Im Folgenden werden zwei dieser Lehrprojekte vorgestellt. 


1 Was ist Christliche Archäologie? 


Das Fach Christliche Archäologie beschäftigt sich mit den materiellen Zeugnis- 
sen des frühen Christentums in den geographischen Gebieten des ehemaligen 
Römischen Reiches rund um das Mittelmeer und darüber hinaus wie beispiels- 
weise entlang der Seidenstraßen. Zeitliche Forschungsschwerpunkte liegen auf 
der Spätantike, dem Frühmittelalter sowie in mittel- und spätbyzantinischer 
Zeit. Neben archäologischen Funden und Befunden werden auch die kulturel- 
len Kontexte frühchristlicher Lebenswelten berücksichtigt und erforscht. Zum 
fachlichen Grundlagenwissen gehören Kenntnisse der zentralen Monumente 
und Denkmäler der Spätantike und des frühen Christentums sowie der wichtigs- 
ten biblischen und außerbiblischen Textquellen. Die Christliche Archäologie 
steht somit chronologisch zwischen benachbarten Fächern wie der Klassischen 
und Provinzialrömischen Archäologie und der Kunstgeschichte. Enge inhaltli- 
che Anbindungen und fachlicher Austausch bestehen zu den genannten Fä- 
chern ebenso wie zur Theologie und Geschichtswissenschaft. An der FAU ist 
das Fach organisatorisch in den Fachbereich Theologie eingegliedert und in un- 
terschiedliche Studiengänge eingebunden, zum Beispiel Archäologische Wis- 


1 Generation Z: Metastudie über die kommende Generation (2016): 4, hg. v. Triple-A-Team-AG, 
Zugriff am 30.06.2021, http://tripleateam.ch/wp-content/uploads/2016/06/Generation_Z_Meta 
studie.pdf. 

2 Philippe Wampfler, Generation „Social Media“: Wie digitale Kommunikation Leben, Beziehun- 
gen und Lernen Jugendlicher verändert (Göttingen: Vandenhoeck & Ruprecht, 2014), 22. 
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senschaften, Mittelalter- und Friihe Neuzeitstudien, Evangelische Theologie, 
Kulturgeschichte des Christentums. Christliche Archäologie ist nicht als eigenes 
Fach studierbar, und der Bestandteil „christlich“ in der Denomination des Teil- 
fachs führt bei Archäologiestudierenden zu Beginn ihres Studiums immer wie- 
der zu Fehleinschätzungen der Fachinhalte. 


2 CA 2.x - Christliche Archäologie im Inverted 
Classroom 


Seit April 2018 ist das Projekt CA 2.x - Christliche Archäologie im Inverted Class- 
room am Lehrstuhl für Christliche Archäologie der FAU angesiedelt. Es setzt 
sich aus didaktischer Perspektive mit den Auswirkungen der digitalen Transfor- 
mation unserer Gesellschaft auf das Lernverhalten der Studierenden und mit 
den daraus resultierenden neuen Anforderungen an eine zeitgemäße Hoch- 
schullehre auseinander. Entwickelt und erprobt wurde das Konzept für den pro- 
pädeutischen Kurs Einführung in die Christliche Archäologie, der turnusmäßig 
jedes Wintersemester angeboten und mit einer Klausur abgeschlossen wird. 
Diese Lehrveranstaltung wird von Studierenden unterschiedlichster Fachrich- 
tungen besucht, zum Beispiel der Archäologie und Kunstgeschichte sowie der 
Evangelischen Theologie. Das Projekt reagiert zum einen auf stark gestiegene 
Studierendenzahlen bei einer gleichbleibenden Anzahl von Dozierenden und 
die damit verbundene Undurchführbarkeit der bisherigen Lehrformate, denn 
die zuvor vorgesehenen Kurzreferate von Studierenden hatten sich bei einer 
Gruppengröße mit 50 oder 60 Personen zu einem didaktisch wenig sinnvollen 
Vortragsstakkato entwickelt. Zum anderen greift es die veränderten Lern- und 
Rezeptionsgewohnheiten der neuen Studierendengeneration (Generation Z) 
auf, die auch dazu geführt haben, dass grundlegende Kompetenzen des geistes- 
wissenschaftlichen Arbeitens - wie das eigenständige Leseverstehen komplexer 
Texte — nicht mehr vorausgesetzt werden können. 

Das Lehrprojekt verfolgt das Konzept des Inverted Classroom? und fußt auf 
drei Säulen: Erstens werden zentrale und klausurrelevante Inhalte durch Lehr- 


3 Vgl. dazu zunächst die grundlegende Literatur von und für Jürgen Handke, dem Pionier der 
digitalen Hochschullehre im deutschsprachigen Raum: Jürgen Handke, Patient Hochschullehre: 
Vorschläge für eine zeitgemäße Lehre im 21. Jahrhundert (Marburg: Tecum, 2014); Ders., Hand- 
buch Hochschullehre digital: Leitfaden für eine moderne und mediengerechte Lehre (Marburg: 
Tecum, 2015); Inverted classroom and Beyond: Lehren und Lernen im 21. Jahrhundert, hg. v. 
Eva-Marie Großkurth und Jürgen Handke (Marburg: Tecum, 2016); Inverted Classroom: Past, 
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videos vermittelt, die den Studierenden zur Vorbereitung der jeweiligen Sitzung 
auf dem universitätseigenen E-Learning-Portal und zudem über den institutsei- 
genen YouTube-Kanal INVESTIGATIO_CA bereitgestellt werden.” Diese können 
im eigenen Lerntempo, orts- und zeitunabhängig sowie beliebig oft angesehen 
werden. Zweitens werden die Studierenden in ihrer Selbstlernphase unterstützt, 
indem auf dem E-Learning-Portal nicht nur die Aufgabenstellungen bereitge- 
stellt werden, unter denen die Videos angesehen werden sollen, sondern auch 
weiterführende Texte, Hintergrundinformationen und Quellentexte. Drittens 
sind die (in der Covid19-Pandemie virtuellen) Präsenzphasen vollkommen neu 
konzeptioniert worden und werden nun dafür genutzt, das zuvor erarbeitete 
Wissen in aktivierenden Lehrformaten zu überprüfen, zu diskutieren und gege- 
benenfalls zu vertiefen sowie die fachrelevanten Skills der Studierenden (zum 
Beispiel Abstraktionsfähigkeit sowie Identifizieren, Extrahieren und Systemati- 
sieren von Information?) zu optimieren. 

Grundlage des Lehrvideokonzepts bilden hinsichtlich der Medienpraxis 
und des Lernverhaltens der Studierenden die Ergebnisse einer eigens zusam- 
mengestellten Zielgruppenanalyse® sowie ein Meinungsbild, das 2018 unter den 


present and future, hg. v. Sabrina Zeaiter und Jürgen Handke (Marburg: Tecum, 2020). Eine 
ertragreiche Zusammenfassung bietet die Festschrift für Jürgen Handke: Pioniergeist, Ausdauer, 
Leidenschaft: Festschrift zu Ehren von Prof. Dr. Jürgen Handke, hg. v. Sabrina Zeaiter und Peter 
Franke (Marburg: Universitätsbibliothek, 2020), doi: 10.17192/es2020.0018. Darüber hinaus vgl. 
für den Fokus diversitätsorientierter Lehre: Eva Nolte und Karsten Morisse, „Inverted Class- 
room: Eine Methode für vielfältiges Lernen und Lehren?,“ in Teaching Trends 2018: Die Prä- 
senzhochschule und die digitale Transformation. Digitale Medien in der Hochschullehre, Bd. 7, 
hg. v. Susanne Robra-Bissantz et al. (Münster: Waxmann, 2019), 105-112. 

4 Sandra Schön und Martin Ebner, Gute Lernvideos: So gelingen Web-Videos zum Lernen! (Nor- 
derstedt: Books on Demand, 2013), 12; YouTube-Kanal INVESTIGATIO_CA, https://www.you 
tube.com/channel/UCaD687K1-gMm5PXf_VHjfcA. 

5 Der Historiker Philippe Rygiel hat auf die Wichtigkeit dieser zentralen Kompetenzen histo- 
risch-geisteswissenschaftlichen Arbeitens auch im digitalen Kontext und bezogen auf den Um- 
gang mit digital vorliegenden Quellen verwiesen, vgl. Philippe Rygiel, Historien à Pâge numé- 
rique: Essai (Villeurbanne: Presses de l’Enssib, 2017), 176. 

6 Die Zielgruppenanalyse basiert auf folgenden Studien: Roman Herzog Institut e.V. (Hg.), 
Neue Werte, neue Gesellschaft, neue Arbeitswelt? Die Generation von Morgen (2016), Zugriff 
am 30.06.2021, https://www.romanherzoginstitut.de/publikationen/detail/die-neue-generati 
on.html; Education Group (Hg.), Oö. Jugend-Medien-Studie 2017: Das Medienverhalten der 11- 
bis 18-Jährige. Medienverhalten der Jugendlichen aus dem Blickwinkel der Jugendlichen (2017), 
Zugriff am 30.06.2021, https://www.edugroup.at/fileadmin/DAM/Innovation/Forschung/Datei 
en/JugendMedienStudie_ZusFassung_2017.pdf; Medienpädagogischer Forschungsverbund 
Südwest (mpfs) (Hg.), JIM 2017: Jugend, Information, (Multi-) Media Basisstudie zum Medien- 
umgang 12- bis 19-Jähriger in Deutschland (2017), Zugriff am 30.06.2021, https://www.mpfs.de/ 
fileadmin/files/Studien/JIM/2017/JIM_2017.pdf; Shell (Hg.), Shell-Jugendstudie 2015: Zusam- 
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Teilnehmer:innen der Einführungsveranstaltung durchgeführt worden ist. Die 
Ergebnisse haben gezeigt, dass die Studierenden zunehmend der sogenannten 
„Generation Z“’ angehören: Durch die Nutzung digitaler Medien ist eine Verän- 
derung des kognitiven Profils erkennbar, das sich merklich von demjenigen der 
Vorgängergenerationen unterscheidet.® Es stellt sich heraus, dass etwa Fahig- 
keiten wie Geduld, Genauigkeit oder Reflexionsvermögen abnehmen und zu- 
dem ein nicht-linearer Lesefluss bevorzugt wird.? Dies führt dazu, dass sowohl 
eine veränderte Methodik zum Erreichen der Lernziele als auch andere Schwer- 
punktsetzungen erforderlich sind, um die neue Studierendengeneration an die 
Arbeitsweisen geisteswissenschaftlicher Disziplinen heranführen zu können. 
Alle rezipierten Studien sowie das erhobene Meinungsbild sind zu dem Ergeb- 
nis gekommen, dass Lehrvideos zum Selbststudium und zur Vorbereitung sei- 
tens der Generation Z sehr erwünscht sind.!° Der Videokonsum erfolgt dabei in 


menfassung (Hamburg 2015), Zugriff am 30.06.2021, https://www.bundestag.de/resource/blob/ 
632026/7558ce0d8a172b47f78c770dfb35d6ac/KDrs-19-28-38_Broschuere-Shell-Jugenstudie- 
data.pdf. Neuere Studien der letzten Jahre bestätigen den Trend, der sich bereits 2015/16 abge- 
zeichnet hat. 

7 Ausführlich zur Generation Z im Bezug zur Hochschule äußert sich Scholz. Christian Scholz, 
„Wie ‚ticken‘ Studierende der Generation Z?“ in Neue Studierendengeneration, neue Herausfor- 
derungen: Fachübergreifende Modelle, Module, Maßnahmen. Eine Dokumentation der Fachta- 
gung der Studierendenakademie der Heinrich-Heine-Universität Düsseldorf, hg. v. Holger Ehlert 
(Düsseldorf: düsseldorf university press, 2017), 15-26. 

8 Andreas Belwe und Thomas Schutz, Smartphone geht vor: Wie Schule und Hochschule mit 
dem Aufmerksamkeitskiller umgehen können (Bern: Hep, 12014), 26-27. 

9 Scholz, Generation Z, 21. Wampfler, Generation „Social Media“, 121. Vgl. zum Leseverhalten 
auch Emese Csobanka, „The Z Generation,“ Acta Technologica Dubnicae 6/2 (2016): 63-76, doi: 
10.1515/atd-2016-0012. Sowie grundsätzlich zum weniger fokussierten Lesen am Bildschirm: 
Gerhard Lauer, Lesen im digitalen Zeitalter (Darmstadt: wbg Academic, 2020): 119, Zugriff am 
30.06.2021, https://files.wbg-wissenverbindet.de/Files/Article/ARTK_ZOA_1024585_0001.pdf. 
Allerdings ist zu betonen, dass bislang empirische Studien, die potenzielle Unterschiede im 
Leseverhalten zwischen berufsbedingtem, akademischen Lesen und Freizeitlesen berücksich- 
tigen, fehlen, ebenso wie solche, die in einem vergleichbaren Setting das unterschiedliche Le- 
sen desselben Textes am Bildschirm und in Printversion untersuchen würden. Vgl. zu diesem 
Desiderat: Axel Kuhn und Svenja Hagenhoff, „Kommunikative statt objektzentrierte Gestal- 
tung: Zur Notwendigkeit veränderter Lesekonzepte und Leseforschung für digitale Lesemedi- 
en,“ in Lesen X.0: Rezeptionsprozesse in der digitalen Gegenwart, hg. v. Sebastian Böck, Julian 
Ingelmann, Kai Matuszkiewicz und Friederike Schruhl (Göttingen: Vandenhoeck & Ruprecht): 
27-45. 

10 Marc Calmbach et al. (Hg.), Wie ticken Jugendliche 2016? Lebenswelten von Jugendlichen im 
Alter von 14 bis 17 Jahren in Deutschland (Wiesbaden: Springer, 2016), 26. 
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hohem Maße via Smartphone," was eine Anpassung von Bildaufbau und Ästhe- 
tik an diese mediale Praxis notwendig macht. 


3 Lehrvideoformate 


Die Videos von CA 2.x werden in einer modularen Struktur erstellt. Im „Haupt- 
video“ (HV) werden in einer Länge von max. 15-20 Minuten auf einer wissen- 
schaftlich anspruchsvollen und abstrakten Ebene die Themen der Lehrveran- 
staltung verhandelt. Die HVs werden thematisch durch „Micro-Teaching-Vide- 
os“ (MTV) ergänzt, die in max. fünf Minuten in freierer optischer Präsentation 
Definitionen, Sachverhalte und Termini vermitteln. Eine weitere Videogruppe 
bilden Videos „von Studierenden für Studierende“, die in Zusammenarbeit mit 
Studierenden entstehen und sich inhaltlich mit relevanten christlich-archäolo- 
gischen Themen oder Objekten beschäftigen. Durch die modulare Struktur ist es 
für die Studierenden möglich, die Videos entsprechend ihres Bedarfs auszuwäh- 
len und zu kombinieren. Da die Lehrvideos nicht nach Lehrveranstaltungssit- 
zungen eines spezifischen Kurses, sondern nach thematischen Einheiten der 
Lehrinhalte gegliedert sind, ist ihre Nachhaltigkeit und freie Kombination er- 
höht.” Durch die modulare Struktur werden außerdem nicht-lineare Sehge- 
wohnheiten aufgegriffen, wodurch auf das veränderte kognitive Profil der Ge- 
neration Z reagiert werden kann. Durch die MTVs und die Videos „von Studie- 
renden für Studierende“ wird die bei der Zielgruppe ausgeprägte Rezeption von 
Lern- und Wissensvideos auf Plattformen wie YouTube (und deren Filmästhe- 
tik) ernst genommen und für die Lehre nutzbar gemacht.” 


11 Achim Berg (Hg.), Kinder und Jugendliche in der digitalen Welt (Berlin, 2019): 4, Zugriff am 
30.06.2021, https://www.bitkom.org/sites/default/files/2019-05/bitkom_pk-charts_kinder_ 
und_jugendliche_2019.pdf. 

12 So kann auf die verkürzte Aufmerksamkeitsspanne der Studierenden reagiert werden: 
Wampfler, Generation „Social Media“, 22. Sowie Belwe und Schutz, Smartphone, 77-78. 

13 Die Videos kommen auch in anderen Lehrveranstaltungen, beispielsweise bei Seminaren 
oder Übungen, gewinnbringend zum Einsatz. 

14 Bei der Videoplattform YouTube handelt es sich seit Jahren um das beliebteste Internetan- 
gebot der Generation Z. Medienpädagogischer Forschungsverbund Südwest (mpfs) (Hg.), JIM 
2020: Jugend, Information, Medien. Basisuntersuchung zum Medienumgang 12- bis 19-Jähriger 
(2021), Zugriff am 30.06.2021, https://www.mpfs.de/fileadmin/files/Studien/JIM/2020/JIM-Stu 
die-2020_Web_final.pdf. Vgl. bereits Medienpädagogischer Forschungsverbund Südwest, JIM 
2017, 32. Junge Erwachsene informieren sich bevorzugt auf YouTube über Wissenschaftsthe- 
men: Wissenschaft im Dialog gGmbH (Hg.), Wissenschaftsbarometer 2020: Ergebnisse nach 
Subgruppen (Berlin, 2020), Zugriff am 30.06.2021, https://www.wissenschaft-im-dialog.de/file 
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Die HVs bieten über die reine Vermittlung von Fakten die Möglichkeit, grö- 
ßere Themengebiete in ihrer Komplexität zu verdeutlichen. Neben der inhalt- 
lichen Tiefe ist hierbei stets das Ziel, künstlerisch anspruchsvolle Videos zu 
erstellen, die auch filmisch überzeugen. Bisher ist ein HV zur frühchristlichen 
Sakralarchitektur entstanden, bei dem Greenscreenaufnahmen und Realfilmse- 
quenzen gedreht werden konnten, sowie Passagen mit zahlreichen Abbildun- 
gen und Fotografien kombiniert worden sind. 


Abb. 1: Ute Verstegen mit der Replik einer spätantiken Öllampe am Set des HVs „Sakralarchi- 
tektur“ in der Friedenskirche in Potsdam (Foto: Falk Nicol, 2018). 


Die Studierenden sollen in diesem Video beispielsweise lernen, dass sinnliche 
Raumeindrücke für die Interpretation archäologischer Monumente unerlässlich, 
zugleich aber kulturell und zeitlich gebunden sind. Eine andere gestalterische 
Lösung wurde für die filmische Umsetzung der Fachgeschichte gefunden: Fik- 
tive Interviews in der Ästhetik des Schwarzweißfilms porträtieren ausgewählte 
Fachvertreter:innen der letzten Jahrtausende, wobei durch die humorvolle 
Wahl der Drehorte und Requisiten bewusst eine Brechung mit fachlicher „Held: 
innenverehrung“ erzeugt worden ist. 


admin/user_upload/Projekte/Wissenschaftsbarometer/Dokumente_20/20_WiD_Tabellenband_ 
Wissenschaftsbarometer2020_final.pdf. 


288 —— Lara Mührenberg, Ute Verstegen 


Abb. 2: Josef Strzygowski (dargestellt von Sebastian Watta) und Joseph Wilpert (dargestellt 
von Alexander Proksch) im Gespräch mit Lara Mührenberg (Foto: Falk Nicol, Stella Enge und 
Luis Fensel, 2019). 


Über das umfassende HV hinaus, das die historischen Persönlichkeiten vorstellt 
und ihre Forschungen in einen zeit- und wissenschaftsgeschichtlichen Kontext 
einbettet, sind zu allen Forschenden Langfassungen der Interviews abrufbar. 

Die MTVs heben sich in Stil und Sprache deutlich von den HVs ab: Sie wer- 
den im Whiteboard-Stil erstellt. Für die Videos sind eigens Comic-Zeichnungen 
sowie ein Designkonzept erarbeitet worden, die einen unverwechselbaren Stil 
ermöglichen. 


Abb. 3: Die Heilige Helena, das Maskottchen des YouTube-Kanals INVESTIGATIO_CA, und Kai- 
ser Konstantin (Zeichnungen: Lara Mührenberg). 
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Sprache, Intonation und Geschwindigkeit orientieren sich an der bei der Ziel- 
gruppe beliebten YouTube-Asthetik. In 3-5 Minuten können so fachrelevante 
Termini, Fakten, Daten und so weiter zu ausgewählten Themen vermittelt wer- 
den. 


Kelche und Patenen 


Abb. 4: In einem Video der Studierenden Milena Bergmann und Marin A. Frank erläutert der 
spätantike Bischof Maximian die liturgischen Ausstattungselemente frühchristlicher Kirchen- 
bauten (Foto: Milena Bergmann und Marin A. Frank) 


Die Videos „von Studierenden für Studierende“ erstellen die Studierenden mit 
Unterstützung durch die Lehrenden und technisch versierte Hilfskräfte. Im 
Sommersemester 2019 ist eigens eine Lehrveranstaltung angeboten worden, in 
welcher die Studierenden relevante Grundlagenkenntnisse wie das Erstellen 
von Drehbüchern, die Fokussierung der Zielgruppe, das Formulieren von Lern- 
zielen, das Schreiben von Texten sowie das Agieren vor der Kamera erlernen 
konnten. In ihren Videos befassen sich die Studierenden mit ganz unterschied- 
lichen Themen, beispielsweise antiken und mittelalterlichen Mauertechniken 
oder der liturgischen Ausstattung frühchristlicher Kirchenbauten. 


15 Vgl. zur Erstellung geeigneter Lernvideos: Schön und Ebner, Lernvideos. Sowie Jan Ull- 
mann, „Entwicklung von Erklärvideos für einen Englisch Selbstlernkurs im Rahmen des ‚Flip- 
ped Classroom‘ Prinzips“ (Dissertation, LMU München, 2018), doi: 10.5282/edoc.22645. 
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4 Präsenzphasen 


Eine besondere Herausforderung für die Lehre ist, dass nicht nur die Dozieren- 
den, sondern auch Kommiliton:innen, die sich in höheren Semestern befinden 
oder bereits älter sind, nicht der Generation Z angehören. Für sie können digi- 
tale Methoden, die sich an der Ästhetik und am kognitiven Profil der Generation 
Z orientieren, ungewohnt sein. Daher ist das Inverted Classroom-Konzept zu- 
nächst nur in der Einführungsveranstaltung angeboten worden, in welcher die 
jüngsten Studierenden anzutreffen sind. Eine weitere Herausforderung ist, dass 
die Angehörigen der Generation Z zwar ausnahmslos mit Smartphones ausge- 
stattet sind, mit denen sie alle Dateiformate (Videos, PDFs und so weiter) anse- 
hen,'° aber zu Beginn des Studiums - zumindest vor der aktuellen Covid19-Pan- 
demie-Situation — keinen Laptop besaßen oder nutzten, was unter anderem bei 
der Erstellung von Hausarbeiten und Referatspräsentationen ein Problem dar- 
stellte. Zudem ist festzustellen, dass die Studierenden nur ungern selbst im Se- 
minar aktiv werden möchten. Das Inverted Classroom-Konzept bietet durch die 
Neukonzeptionierung der Prasenzphasen” nun aber die Möglichkeit, die Stu- 
dierenden aus ihrer Komfortzone zu holen und sie zu aktiver Mitarbeit zu er- 
muntern. Sogar in der Videokonferenz-Lehre unter den Bedingungen der Co- 
vid19-Pandemie, in der viele Lehrende ausgeschaltete Kameras und Mikros be- 
klagt haben, hat dies sehr gut funktioniert. 

Alle Maßnahmen zielen darauf ab, die Studierenden durch die Nutzung di- 
gitaler Methoden für die Auseinandersetzung mit Fachinhalten der Christlichen 
Archäologie zu begeistern und zugleich grundlegende Techniken der geistes- 
wissenschaftlichen Arbeit zu vermitteln.'® Da nach dem ersten Testlauf des Kon- 
zepts festgestellt werden musste, dass viele Studierende unvorbereitet zu den 


16 Vgl. dazu: Medienpädagogischer Forschungsverbund Südwest, JIM 2017, 26. 

17 Ausführlich zur Konzeption und Umsetzung der Präsenzphasen: Lara Mührenberg und Ute 
Verstegen, „CA 2.x - Christliche Archäologie im inverted classroom: Ein Beitrag zur videoba- 
sierten digitalen Lehre an der Friedrich-Alexander-Universität Erlangen-Nürnberg,“ in Zeaiter 
und Handke (Hrg.), Inverted Classroom, 165-177. Sowie Lara Miihrenberg, „CA 2.x - Christliche 
Archäologie im inverted classroom,“ in Vom Untergrund ins Internet: Die Institute für Ur- und 
Frühgeschichte, Klassische Archäologie und Christliche Archäologie mit dem gemeinsamen Stu- 
diengang ‚Archäologische Wissenschaften‘ an der Friedrich-Alexander-Universität Erlangen- 
Nürnberg - Stand 2018/19, hg. v. Doris Mischka et al. (Erlangen: Friedrich-Alexander-Univer- 
sität, 2019): 65-67. 

18 Dazu Scholz, Generation Z, 21-23. Gerade in Hinblick auf die Rezeption wissenschaftlicher 
Texte benötigen die Studierenden Unterstützung, da der nicht-lineare Lesefluss der Studieren- 
den es ihnen erschwert, lange und komplexe Fachtexte zu verstehen. Vgl. dazu Belwe und 
Schutz, Smartphone, 81. Sowie Wampfler, Generation „Social Media“, 121. 
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Präsenzsitzungen erschienen sind, ist ein kurzer E-Selbsttest eingeführt wor- 
den, der in Vorbereitung zu den Sitzungen zu absolvieren ist.” 

Durch die ineinandergreifende Struktur aller Bestandteile des Lehrkon- 
zepts, die Ausrichtung auf die Lernziele (Wissen und Kompetenzen) und die de- 
taillierte Ermittlung und Einbeziehung der Bedarfe der Studierenden ist es mög- 
lich, in der Klausur neben reinen Fakten in offenen Fragen Wissen und Kompe- 
tenzen abzuprüfen. Die Ergebnisse der Klausuren zeigen, dass durch die 
stärkere Aktivierung in den Präsenzveranstaltungen Anwendungswissen und 
Transferleistungen der Kursteilnehmenden besser werden und nicht nur aus- 
wendig gelerntes Faktenwissen wiedergegeben werden kann. Die Rückmeldung 
der Studierenden zeigt, dass die kurzen MTVs besonders beliebt sind und diese 
wiederholt abgerufen werden. Zum Ende des Wintersemesters 2019/20 ist zu- 
dem eine Evaluation durchgeführt worden.” Auch diese Ergebnisse waren sehr 
positiv und zeigen, dass die Kombination aus Präsenzphasen und eigenständi- 
ger Vorbereitung auch aus Sicht der Studierenden einen Gewinn darstellt.” Es 
hat sich gezeigt, dass das Konzept vor allem die jüngeren Studierenden stark 
anspricht. Vor allem die Studienanfänger:innen favorisieren klar eine Wissens- 
vermittlung über kurze Videoformate gegenüber längeren Videos oder Textres- 
sourcen. Im Rahmen der pandemiebedingten Online-Lehre wird das Inverted 
Classroom-Konzept im Verhältnis zur reinen Videokonferenz-Lehre besonders 
positiv reflektiert.” 


5 Virtual Excursions 


Bereits vor dem Beginn der Covid19-Pandemie, die zu einem Ausbau der digita- 
len Lehrangebote geführt hat, ist am Lehrstuhl für Christliche Archäologie ein 


19 Die Idee, die Studierenden vor der Präsenzphase auf ihren Selbstlernerfolg hin zu prüfen, 
stammt im Ursprung von Handke: Zeaiter und Franke, Pioniergeist, 93-100. 

20 Hierfür ist das Inventar zur Evaluation von Blended Learning (IEBL) des Leibniz-Instituts 
verwendet worden. Dieses basiert auf dem hinlänglich erprobten und psychometrisch validier- 
ten Heidelberger Inventar zur Lehrveranstaltungsevaluation in seiner revidierten Fassung (HIL- 
VE-ID. Das IEBL selbst wurde psychometrisch überprüft (n=122). 

21 Zu vergleichbaren Ergebnissen kommen auch Claudia Mertens et al., „‚To flip or not to 
flip?‘: Empirische Ergebnisse zu den Vor- und Nachteilen des Einsatzes von Inverted-Class- 
room-Konzepten in der Lehre,“ in Hochschullehre als reflektierte Praxis: Fachdidaktische Fall- 
beispiele mit Transferpotenzial, hg. v. Tobias Schmohl and Kieu-Anh To (Bielefeld: Bertels- 
mann, 72019): 13-28. 

22 Die Studierenden haben in der miindlichen Feedbackbesprechung zur Lehre unter Bedin- 
gungen der Covid19-Pandemie äußerst positive Rückmeldung zu diesem Lehrformat gegeben. 
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zweites digitales Lehrprojekt geplant worden: Seit Sommer 2020 wird das Pro- 
jekt Virtual Excursions verfolgt.” Dieses Lehrprojekt hat zum Ziel, auf innovative 
Weise das Lehrangebot durch virtuelle Exkursionen mithilfe von 360°-Aufnah- 
men zu verbessern und zu ergänzen. Zum fachlichen Grundlagenwissen der 
Christlichen Archäologie gehören Kenntnisse der zentralen Monumente und 
Denkmäler der Spätantike und des frühen Christentums, welche in der Lehre 
durch visuelle Repräsentationen der entsprechenden Denkmäler im Seminar 
oder durch Exkursionen an ihre (Stand-)Orte erworben werden. Den optimalen 
Lernerfolg für das Kennenlernen und Verstehen dieser Denkmäler erzielt erfah- 
rungsgemäß der persönliche Besuch der Originale mittels Exkursionen zu Muse- 
en oder an antike Stätten. Die eigene Sinneswahrnehmung und die körperliche 
Erfahrung ermöglichen es, die Denkmäler in ihren Größendimensionen und 
räumlichen Kontexten zu erfahren und zu analysieren.” Dies erzielt auch eine 
bessere Memorierbarkeit als das Betrachten von Abbildungen in Büchern oder 
von Fotos auf PowerPoint-Präsentationen. 

Eine vergleichbare Erfahrung eröffnen 360°-Aufnahmen, in welche man 
mittels einer Virtual Reality-Brille eintreten kann. Es besteht die Option, sich zu 
drehen und auf- und abzuschauen und auf diese Weise einen Raumeindruck zu 
erhalten, Entfernungen abzuschätzen, die Lage bestimmter Bauteile zueinander 
zu ermessen, Blickachsen zu verstehen und anderes. All dies ist durch zweidi- 
mensionale Pläne und Abbildungen nur eingeschränkt möglich und erfordert 
jahrelange Einübung. Die Option, im Seminar einen Kirchenraum oder eine 
Grabkammer virtuell zu bereisen, bereichert die Lehre grundsätzlich und er- 
leichtert den Studierenden das Verständnis. Zudem können die Studierenden so 
orts- und zeitunabhängig auf die Monumente zugreifen, was ein Gewinn für die 


23 Die wissenschaftliche Auseinandersetzung mit dem Einsatz von Virtual Reality in der Lehre 
ist in den letzten Jahren sprunghaft angestiegen. Grundlegend sei auf folgende Literatur ver- 
wiesen: Gökce Akcayir und Carrie Demmans Epp, Designing, Deploying, and Evaluating Virtual 
and Augmented Reality in Education (Hershey, Pennsylvania: IGI Global, 2021); Dong Hwa Choi, 
Amber Dailey-Hebert und Judi Simmons Estes, Emerging Tools and Applications of Virtual Rea- 
lity in Education (Hershey, Pennsylvania: IGI Global, 2016). Eine Einführung in Funktionswei- 
sen und Anwendungsmöglichkeiten bietet: Zeynep Tacgin, Virtual and Augmented Reality: An 
Educational Handbook (Cambridge: Cambridge Scholars Publishing, 2020). 

24 Zur Konstituierung von Räumen durch ihre Besucher:innen vgl. Martina Löw, Raumsozio- 
logie (Frankfurt a. M.: Suhrkamp, °2017). Analysen zum Potenzial der Erschließung von Räu- 
men durch Exkursionen als Lehrformat stammen bislang vor allem aus der Geographie: Kerstin 
Neeb, Geographische Exkursionen im Fokus empirischer Forschung: Analyse von Lernprozessen 
und Lernqualitäten kognitivistisch und konstruktivistisch konzeptionierter Schülerexkursionen 
(Weingarten: Selbstverlag des Hochschulverbandes für Geographie und ihre Didaktik, 2012); 
Anne-Kathrin Lindau und Tom Renner, „Räume durch geographische Exkursionen und Fragen 
erschließen,“ Hallesches Jahrbuch für Geowissenschaften 41 (2018): 63-76. 
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Nachbereitung der Seminarsitzungen, die Vorbereitung von Referaten, das Ler- 
nen für Prüfungen und vor allem für die Erarbeitung der Denkmälerkenntnis, 
die für unser Fach außerordentlich wichtig ist, darstellt. 

Ziel des Projektes ist es nicht, reale Reisen an archäologische Stätten abzu- 
schaffen, denn die Wahrnehmung eines Raumes oder Ortes mit allen dem Men- 
schen zur Verfügung stehenden Sinnen, ist (noch) nicht ersetzbar. Vielmehr 
soll die Möglichkeit geschaffen werden, ein Monument nach Bedarf in simulier- 
ter Dreidimensionalität in Augenschein nehmen zu können. Ein gewichtiger 
Vorteil virtueller Reisen ist dabei zudem, dass sie eine klimaneutrale sowie kos- 
ten- und zeitgünstige Alternative darstellen. Darüber hinaus erlauben sie, für 
den Fall unvorhersehbarer Krisen (wie das Corona-Virus oder beispielsweise 
eine Verschlechterung der weltpolitischen Lage), welche die Durchführbarkeit 
von Studium und Lehre einschränken, vorzusorgen. 

Für die Erstellung eines Lehrkonzeptes konnte auf die Forschungen und Er- 
fahrungen des Projekts CA 2.x - Christliche Archäologie im Inverted Classroom 
zurückgegriffen und aufgebaut werden. Insbesondere die Erkenntnis, dass eine 
modulare Struktur dem kognitiven Profil der Generation Z entgegenkommt, hat 
auch hier Berücksichtigung gefunden, so dass die mit 360°-Videos und -Fotos 
dokumentierten Bauten ausgerichtet nach individuellen Bedürfnissen besucht 
werden können. Das Einsatzszenario von Digitalpanoramen in der kunsthistori- 
schen und archäologischen Lehre ist nicht neu.” Durch den Markteintritt ent- 
sprechender 360°-Kameras und VR-Headsets zu erschwinglichen Konditionen 
in den Consumerbereich können nun aber neue Möglichkeiten ausgelotet wer- 
den, die wesentlich betrachterimmersiver sind als zuvor. Ein weiterer zentraler 
Punkt der Projektkonzeption ist daher, nicht nur „begehbare“ Standbilder anzu- 
fertigen.” Vielmehr sollen, einer realen Exkursion möglichst ähnlich, Lernsitua- 
tionen erzeugt werden, in welche die Studierenden über einen Screen oder so- 
gar mittels einer VR-Brille eintreten können. Analog zu realen Exkursionen wer- 
den sie in den Videos von Expert:innen durch die Monumente geführt. Diese 
zeigen Besonderheiten der Bauten auf und diskutieren fachliche Fragen direkt 


25 Ute Verstegen, „Abschied vom Dia - eine Reprise: Digitale Repräsentationen dreidimensio- 
naler Bauten und Objekte in der kunsthistorischen Lehre,“ Kunstchronik 58 (2005): 347-348; 
Dies., „Vom Mehrwert digitaler Simulationen dreidimensionaler Bauten und Objekte in der 
architekturgeschichtlichen Forschung und Lehre“ (Vortrag gehalten auf dem XXIX. Deutschen 
Kunsthistorikertag, Regensburg, 16. März 2007), doi: 10.11588/artdok.00000473. 

26 Vgl. einen der wenigen ersten Erfahrungsberichte zu den Vorteilen der Nutzung von 360°- 
Videos: Laura J. Thompson et al., „Using 360-degree video for immersive learner engagement,“ 
Journal of Extension 56/5 (2018), Zugriff am 30.06.2021, https://tigerprints.clemson.edu/joe/ 
vol56/iss5/1/. 
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am Bau und Objekt. Durch den Eindruck, Teil einer Exkursionsgruppe zu sein, 
soll erreicht werden, eine beinahe partizipative Situation zu erzeugen. 


6 360°-Videos 


Auch die 360°-Videos werden in einer modularen Struktur erstellt. Im Septem- 
ber 2020 sind trotz der Covid19-Pandemie erste Drehaufnahmen in Trier und 
Köln möglich gewesen. Unter anderem sind 360°-Videos der sogenannten Kon- 
stantinbasilika beziehungsweise Palastaula in Trier und der Kirche St. Gereon 
in Köln entstanden. Jeweils sind typische Exkursionssequenzen an wechseln- 
den Orten inner- und außerhalb des Baus nachempfunden worden. Dabei sind 
nicht nur die Ausführungen der Expertinnen, die durch die Räume geführt ha- 
ben, eingefangen, sondern gezielt auch Lehrsituationen und Diskussionen er- 
zeugt worden, wie sie üblicherweise bei realen Exkursionen entstehen. Nach- 
träglich sind die Videos aufwändig bearbeitet worden; so sind beispielsweise ei- 
gens erstellte Pläne in die Videos eingefügt worden, um die Orientierung im 
Raum zu unterstützen und die Verortung innerhalb der baulichen Struktur zu 
ermöglichen. 


I4 P pbi AÒ 142/1045 


Abb. 5: Ute Verstegen führt durch den Kirchenbau St. Gereon in Köln. Der eingefügte Plan er- 
möglicht die Orientierung im Gebäude (Foto: Falk Nicol, Alissa Dittes und Luis Fensel, 2020). 
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Zusätzlich zu den geführten virtuellen Rundgängen sind klassische 360°-Stand- 
bilder an verschiedenen Standorten innerhalb und außerhalb der Gebäude er- 
stellt worden, die eine eigenständige und bedarfsorientierte virtuelle Begehung 
der Orte ermöglichen. 

Weitere 360°-Videos sollen in Zukunft im Rahmen realer Exkursionen zu 
Stätten und Denkmälern des frühen Christentums aufgenommen werden. Zu- 
dem erlauben die geringen Abmessungen der 360°-Kamera, sie auch auf Dienst- 
reisen mitzunehmen und bei der Besichtigung relevanter Monumente relativ 
spontan ein Video zu drehen. Für die Nutzung über den persönlichen wissen- 
schaftlichen Gebrauch hinaus ist hierfür jedoch das Einholen von Drehgeneh- 
migungen im Vorfeld zu beachten. 


7 Umsetzung in der Lehre 


Aufgrund der Covid19-Pandemie mussten seit März 2020 alle geplanten Exkur- 
sionen des Lehrstuhls abgesagt werden. Da die Studierenden des Studiengan- 
ges Archäologische Wissenschaften aber im Bachelorstudium Exkursionsmodule 
mit mindestens 10 ECTS nachweisen müssen, wurden im Wintersemester 2020/1 
und im Sommersemester 2021 vor allem für die kurz vor dem Abschluss stehen- 
den Studierenden virtuelle Exkursionen angeboten.” Im Winter wurde auf das 
lehrstuhleigene Material zurückgegriffen und virtuell nach Köln und Trier ge- 
reist. Die Lehrveranstaltung kombinierte die individuelle Erfahrung der virtuel- 
len Expertinnenführungen in St. Gereon und in der Trierer Palastaula per VR 
oder YouTube-360°-Video mit Gruppenreferaten von Studierenden über andere 
archäologische Stätten in Trier, an denen unkommentierte 360°-Videos und 
-Standbilder aufgenommen worden waren (Porta Nigra, Barbarathermen, Kai- 
serthermen). Die Referate fanden über die Videokonferenz-Software Zoom statt, 
wobei die Studierenden zur Präsentation unterschiedliche Kombinationen aus 
PowerPoint und Online-Videosequenzen nutzten. Da die Studierenden selbst 
keine eigenen VR-Brillen besaßen, wurde eine Sitzung durchgeführt, in der eine 
Anleitung zum Basteln eines Cardboards für das eigene Smartphone gegeben 


27 Luise Drake et al., „Digitale Lehre in den archäologischen Wissenschaften an der Friedrich- 
Alexander-Universität Erlangen-Nürnberg - Erfahrungen nach einem Jahr Coronapandemie,“ 
Blickpunkt Archäologie 2 (2021): 103-113. 
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wurde. Erganzend wurde durch eine Hilfskraft des Lehrstuhls zusatzlich ein Do- 
It-Yourself-Video erstellt und auf den YouTube-Kanal hochgeladen.” 


DIY: VR-Brille basteln oe» 


Konzept und SCNNITt 
Alissa Dittes 


Abb. 6: Alissa Dittes erklart im YouTube-Video, wie man aus dem Smartphone eine VR-Brille 
bastelt (Foto: Christopher Koch, 2021). 


Die VR-Lernsituation variierende Präsenzsitzungen waren wegen der strengen 
Hygienevorschriften bis Herbst 2021 nicht möglich. Geplant sind vor allem Tests 
zu zwei Rezeptionssituationen: das gemeinsame Betrachten der VR-Videos im 
Seminarraum via Beamer und die gemeinsame Rezeption eines 360°-Standbilds 
via VR-Brille durch mehrere Studierende gleichzeitig im selben Raum. In beiden 
Lernsituationen soll der gemeinsame fachliche Austausch über den virtuell be- 
suchten Ort gefördert werden. Ziel ist, durch diese Rezeptionssituationen zu er- 
proben, wie nah eine Gruppe an das gemeinsame Lernerlebnis einer realen Ex- 
kursion herangeführt werden kann und welche spezifischen Erfordernisse für 
den Lernerfolg durch das VR-Erleben noch nicht erfüllt werden können. 

Da viele Museen ihr Online-Angebot im Verlauf der Covid19-Pandemie stark 
ausgebaut haben und nun auch virtuelle Rundgänge anbieten,” führte die vir- 
tuelle Exkursion im Sommersemester 2021 in die Eremitage nach St. Petersburg. 


28 DIY: VR-Brille basteln, Zugriff am 30.06. 2021, https://www.youtube.com/watch? 
v=Lk6KIgEFd70. 

29 Vgl. Ellie King et al., „Digital Responses of UK Museum Exhibitions to the COVID-19 Crisis, 
March-June 2020,“ Curator: The Museum Journal (2021): 9, doi: 10.1111/cura.12413; Peter Max- 
well, „The rise of the virtual gallery tour: What works and what doesn’t (yet),“ Frame 8 (2020), 
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Die Lehrveranstaltung griff hierbei auf das durch das Museum selbst bereitge- 
stellte Angebot eines virtuellen Rundgangs zurück.” Während einige Museen, 
die mit ihren digitalen Angeboten eine Vorreiterrolle auf dem internationalen 
Museumsparkett einnehmen, inzwischen virtuelle Touren anbieten, bei denen 
die Ausstellungsbereiche per Indoor Mapping mit LiDAR-Technologie 3D-digita- 
lisiert wurden und deren Punktwolken von den Online-Nutzer:innen on the fly 
durchschritten werden können,” nutzen viele Häuser weiterhin 360°-Panora- 
men. Auch diese lassen sich in der Lehre durchaus gewinnbringend einsetzen. 
Die 360°-Panoramen der musealen Räume der Eremitage umfassen beispiels- 
weise auch Erschließungssituationen wie Treppen und Korridore, so dass der 
Weg von der Kasse bis zum gesuchten Museumsobjekt in seiner Vitrine sehr gut 
virtuell nachvollzogen werden kann. Für einen wesentlichen Teil der ausgestell- 
ten Objekte existieren in den VR-Rundgängen der Eremitage zudem Verlinkun- 
gen von der Vitrine in den digitalen Sammlungskatalog, der zwar öffentlich 
noch wenige Meta-Informationen, dafür aber zum Beispiel passable Fotos der 
Objekte enthält. 

Die virtuelle Museumsexkursion nach St. Petersburg, welche ebenfalls als 
Online-Veranstaltung via Zoom stattfand, zielte wiederum darauf, verschiede- 
ne, möglichst partizipative Lehr-/Lernszenarien anhand des zur Verfügung ste- 
henden Online-Angebots zu erproben. Neben den virtuellen Referaten vor den 
Vitrinen erschlossen sich die Studierenden die Museumsräume auch in Klein- 
gruppen in sogenannten Breakout-Rooms, das sind Gruppenarbeitsräume der 
Software Zoom, und ‚schlenderten‘ gemeinsam durch den virtuellen Rundgang. 
Dieses Format wurde von den Studierenden in der Abschlussevaluation sehr be- 
grüßt. Die Evaluation hat darüber hinaus klar gezeigt, dass sich die Studieren- 
den das Format virtueller Exkursionen auch nach der Covid19-Pandemie als er- 
sänzendes Format im Lehrportfolio wünschen. Positiv hervorgehoben wurde 
die Möglichkeit, auf diese Weise Museen und Ausgrabungsstätten bereisen zu 
können, die aus politischen, konservatorischen oder finanziellen Gründen nicht 
zugänglich sind oder deren Besuch durch eine Gruppe mit einer besonders 
schlechten Klimabilanz verbunden wäre. Ebenfalls geschätzt wurde die Mög- 


Zugriff am 30.06.2021, https://www.frameweb.com/article/the-rise-of-the-virtual-gallery-tour- 
what-works-and-what-doesnt-yet. 

30 The State Hermitage Museum, Zugriff am 30.06.2021, https://srv1.hermitagemuseum.org/ 
wps/portal/hermitage/panorama. 

31 Beispielsweise das Deutsche Museum in München, https://virtualtour.deutsches-museum. 
de/. Beispiele für archäologische Museen sind das Musée national d’histoire et d’art in Luxem- 
burg, https://my.matterport.com/show/?m=S1wvMgypEXN und das Anadolu Medeniyetleri 
Müzesi in Ankara, https://matterport.com/de/media/3414?industry%5B8%5D=8&industry% 
5B6%5D=6, Zugriff am 30.06.2021. 
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lichkeit, sich künftig durch die Nutzung der virtuellen Rundgänge besser auf 
einen konkreten Museumsbesuch vorbereiten zu können und bereits den Weg 
zu den gesuchten Museumsobjekten im Vorfeld virtuell abgehen zu können. 

Um bestehende museale Angebote für universitäre virtuelle Exkursionen 
mit Studierenden noch besser nutzen zu können, wären in Zukunft Szenarien 
von Interesse, welche zum einen die Kommunikation mit den Fachkurator:in- 
nen in den Museen durch ein Zuschalten in die Online-Konferenz einbeziehen 
und zum anderen die Kontextualisierung von Einzelobjekten über ihr Vitrinen- 
dasein hinaus erweitern könnten.” Links auf 3D-Digitalisate der Sammlungsob- 
jekte aus dem virtuellen Rundgang heraus, wie sie das Harvard Museum of the 
Ancient Near East bereits anbietet,” könnten beispielsweise mit maßstabsge- 
rechten Einblendungen von 3D-Vergleichobjekten aus anderen Sammlungen 
verbunden werden. 


8 INVESTIGATIO_CA 


Der YouTube-Kanal INVESTIGATIO_CA* des Lehrstuhls ist 2019 online gegan- 
gen. Im Sinne des Konzepts von Open Educational Resources wird christlich-ar- 
chäologisches Wissen hier einer breiten Öffentlichkeit innerhalb und auch au- 
ßerhalb der Universitäten zugänglich gemacht. Ein fachfremdes Publikum, Leh- 
rer:innen, Pfarrer:innen und Dozierende anderer Hochschulen können somit 
ebenfalls die erstellten Videos nutzen. Interessant sind die Videos aufgrund der 
gemeinsamen Lehrinhalte für Fächer wie die Kunstgeschichte, die Theologie 
oder die Klassische Archäologie. Sämtliche Filme des Projektes CA 2.x — Christli- 
che Archäologie im Inverted Classroom sowie erste Videos aus dem Projekt Vir- 
tual Excursions sind auf YouTube verfügbar. Auf diese Weise kann auch die 6f- 
fentliche Sichtbarkeit des sogenannten Kleinen Fachs Christliche Archäologie 
erhöht werden.” 


32 Vgl. die Anforderungskriterien in: Caitlin Chien Clerkin und Bradley L. Taylor, „Online En- 
counters with Museum Antiquities,“ American Journal of Archaeology 125/1 (2021): 175, doi: 
10.3764/aja.125.1.0165. 

33 Harvard Museum of the Ancient Near East, Zugriff am 30.06.2021, https://my.matterport. 
com/show/?m=bS17YNKCggy&referrer=https://hmane.harvard.edu. 

34 INVESTIGATIO_CA: https://www.youtube.com/channel/UCaD687K1-gMm5PXf_VHjfcA. 

35 Zur Christlichen Archäologie im Rahmen der Diskussion um sogenannte Kleine Fächer: Ute 
Verstegen, Kleine Fächer im Porträt: Christliche Archäologie (2019), Zugriff am 30.06.2021, 
https://www.kleinefaecher.de/beitraege/blogbeitrag/christliche-archaeologie.html. 
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Die Kanalanalysen der Gesamtlaufzeit seit Juni 2019, die YouTube zur Ver- 
fügung stellt, stellen hierbei eine wichtige Information dar, mit deren Hilfe das 
entwickelte Lehrkonzept hinsichtlich der Anschlussfähigkeit an die Zielgruppe 
kritisch überprüft werden kann. Die Klickzahlen und Kommentare zeigen deut- 
lich, dass Videos, die auch für schulische Lehrinhalte — beispielsweise im Reli- 
gions-, Latein- oder Kunstunterricht — relevant sind, besonders häufig angese- 
hen werden. Neben der Anzahl der Aufrufe ist auch die Anzeigedauer der Vide- 
os aufschlussreich. Es zeigt sich, dass die Videos in der Regel nicht länger als 
für eine Dauer von zwei oder drei Minuten angesehen werden. Die Altersgruppe 
der 18-24-Jährigen stellt die größte Gruppe der Nutzer:innen dar (gefolgt von 
der Gruppe der 45-54-Jährigen). Überraschenderweise überwiegt trotzdem die 
durchschnittliche Nutzung eines Computers als digitales Endgerät (60,2%) ge- 
genüber dem Smartphone (29,3%). Eine eingehende Analyse zeigt jedoch, dass 
dies auf eine Entwicklung zurückzuführen sein dürfte, die mit der Covid19-Pan- 
demie in Zusammenhang steht: Seit Beginn der Online-Lehre an Universitäten 
und Schulen hat sich der Zugriff über Computer (außerhalb der Schul- und Se- 
mesterferien) teilweise verdreifacht. Eine interessante Beobachtung ist hierbei, 
dass die durchschnittliche Wiedergabedauer der Smartphonenutzenden (2,15 
Min.) deutlich hinter der der Computernutzenden (2,30 Min.) zurückbleibt. 
Peaks können in den Zeiträumen verzeichnet werden, in denen mit Prüfungs- 
vorbereitungen zu rechnen ist. 


9 Fazit 


Die Situation der Covid19-Pandemie stellte Lehrende ebenso wie Studierende 
nicht nur vor eine enorme Herausforderung. Aus jetziger Perspektive hat sie 
sich auch als ein Katalysator für die Weiterentwicklung und die Akzeptanz neu- 
er digitaler Lehrformate erwiesen. Mit der Entwicklung der Lehrkonzepte der vi- 
deogestützten Inverted Classroom-Lehre und der virtuellen Exkursionen hatten 
der Lehrstuhl Christliche Archäologie der FAU bereits vor der Covid19-Pandemie 
begonnen. Durch die Anpassung an die Erfordernisse der pandemiebedingten 
Online-Lehre haben sich diese Formate auch als sehr tragfähig für zunächst 
nicht geplante digitale Lehrsituationen erwiesen. Die Evaluationen der Formate 
in Präsenz und in der Online-Lehre zeigen, dass bei den Studierenden der FAU 
eine hohe Akzeptanz und Offenheit für die neu eingeführten Lehrformen be- 
steht. Auch für die Zeit nach der Pandemie wird eine Weiterführung und ein 
Ausbau der Online-Angebote und der Lehrveranstaltungen mit virtuellem Anteil 
gewünscht und bestehen bleiben. 
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René Smolarski, Hendrikje Carius, Marcus Plaul 
Perspectives and Challenges of Historical 
Research with Citizen Participation: 

A Critical Reflection on the Example of 
“Cinema in the GDR” 


Abstract: Participatory research formats have recently gained in importance in 
historical research. This is particularly reflected in the increase in historically 
oriented citizen science projects. However, this development has so far received 
little attention in the relevant research literature and, especially in the German- 
speaking world, remains at best a niche phenomenon. Thus, the aim of this arti- 
cle is to encourage academic debate on the relevance of citizen science in his- 
torical science, with a focus on digital-based approaches. The article begins 
with the definition of citizen science and then examines its positioning in hu- 
manities and historical science, which is followed by a discussion of the poten- 
tials and limitations of participatory approaches based on the research project 
“Cinema in the GDR”. The paper draws on cross-disciplinary and discipline-spe- 
cific studies, initial project-side evaluations, and experiences from the project 
implementation. Finally, the article asks under which prerequisites digital- 
based citizen science approaches could gain long-term acceptance as a research 
method in historical science. 


Keywords: citizen science, digital citizen science, crowdsourcing, public histo- 
ry, cinema history, history of everyday life in the GDR, knowledge and science 
communication 


Zusammenfassung: In der geschichtswissenschaftlichen Forschung haben in 
jüngster Zeit partizipative Forschungsformate stark an Bedeutung gewonnen. 
Dies spiegelt sich vor allem in einer Zunahme historisch orientierter Citizen Sci- 
ence-Projekte wider. Diese Entwicklung findet bislang jedoch kaum Beachtung 
in der einschlägigen Forschungsliteratur und führt vor allem im deutschspra- 
chigen Raum allenfalls ein Nischendasein. Ziel des vorliegenden Beitrags ist da- 
her, die fachwissenschaftliche Debatte über die Tragfähigkeit bürgerbeteiligter 
Forschung in den Geschichtswissenschaften anzuregen und rückt dabei insbe- 
sondere digitalbasierte Zugänge in den Fokus. Ausgehend von einer Definition 
des Citizen Science-Begriffs und dessen Verortung in den Geistes- und Ge- 


3 Open Access. © 2022 René Smolarski, Hendrikje Carius, Marcus Plaul, published by De Gruyter. 
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schichtswissenschaften werden anhand des Forschungsprojektes “Kino in der 
DDR” die Potenziale und Grenzen partizipativer Ansätze herausgearbeitet. Der 
Beitrag stützt sich sowohl auf disziplinübergreifende als auch einige wenige 
disziplingebundene Untersuchungen, erste projektseitige Evaluationen und Er- 
fahrungen aus der Projektumsetzung. Abschließend wird über die Frage disku- 
tiert, unter welchen Voraussetzungen sich digitalbasierte Citizen Science-Ansat- 
ze nachhaltig als Forschungsmethode in den Geschichtswissenschaften etablie- 
ren könnten. 


Schlagwörter: Citizen Science, digitale Citizen Science, Crowdsourcing, Public 
History, Kinogeschichte, Alltagsgeschichte der DDR, Wissen, Wissenschafts- 
kommunikation 


1 Introduction 


First coined in the mid-1990s in the Anglo-Saxon world, the label of citizen sci- 
ence! and related terms such as citizen social science, citizen humanities or 
crowdsourcing (which is more limited with regard to the degree of participation) 
have been used to summarise approaches that aim to involve an interested pub- 
lic in the scientific process of discovery. Since their beginnings, these formats 
have continued to differentiate their objectives in the sense of a public engage- 
ment with science?. In addition to forms of dialogical exchange about science 
(for example science cafes, citizens’ conferences and round tables), they also 
include opportunities of direct cooperation and collaboration in order to gener- 
ate new scientific knowledge.’ Beyond their use in the natural sciences, they 
have recently also found their way into the historical sciences - with a close 
interrelation to research methods and perspectives such as public history, digi- 
tal history or participatory research in general.* Consequently, this corresponds 


1 Cf. Alan Irwin, Citizen Science: A Study of People, Expertise and Sustainable Development 
(London: Routledge, 1995). 

2 Cf. Jack Stilgoe, Simon J. Lock and James Wilsdon, “Why Should We Promote Public Engage- 
ment with Science?” Public Understanding of Science. Special Issue: Public Engagement in Sci- 
ence 23/1 (2014): 4-15, doi: 10.1177/0963662513518154. 

3 Cf. Birte Fähnrich, “Wissenschaftsevents zwischen Popularisierung, Engagement und Par- 
tizipation,” in Forschungsfeld Wissenschaftskommunikation, ed. Heinz Bonfadelli et al. (Wies- 
baden: Springer VS, 2015), 170-171. 

4 For the topic of citizen science in the humanities, see authors such as Kristin Oswald and 
René Smolarski, “Einführung: Citizen Science in Kultur und Geisteswissenschaften,” in Bürger 
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with the increasing significance of public science within a knowledge society in 
which the communication and transfer of knowledge acts as a central compo- 
nent of research. Seen in this context, science and the public sphere are under- 
stood to be in a dialogue-oriented relationship, one that goes beyond the unilat- 
eral social information and educational function of research. These efforts are 
accompanied in a special way by the new possibilities of digital technologies 
and the open science paradigm (open citizen science’). In their combination, 
both components appear as conditional factors of a citizen science oriented to- 
wards a digitally-based interlocking of science and society. On the one hand, 
technical innovations and new digital media make it easier for citizen scientists 
to participate in citizen science projects. On the other hand, digital infrastruc- 
tures and technologies for data analysis and processing provide the basis for a 
more efficient and sustainable handling of the collected data.° In the meantime, 
a multitude of projects that function exclusively as web-based digital citizen sci- 
ence have evolved.’ 

In the German context, citizen science has established itself through initia- 
tives such as the GEWISS Consortium of BiirGEr schaffen WISSen, especially in 
the areas of natural sciences.® However, even if it is possible in the historical 
sciences to refer to traditional lines of voluntary engagement by citizens in his- 
torical associations or historical workshops,’ the prerequisites, basic conditions 


Künste Wissenschaft - Citizen Science in Kultur und Geisteswissenschaften, ed. Kristin Oswald 
and René Smolarski (Guttenberg: Computus, 2016) or Cord Arendes, “Historiker als ‘Mittler 
zwischen den Welten’? Produktion, Vermittlung und Rezeption historischen Wissens im Zei- 
chen von Citizen Science und Open Science,” Heidelberg Jahrbiicher Online 2 (2017): 19-58, 
doi: 10.17885/heiup.hdjbo.2017.23691. 

5 Cf. Katrin Vohland and Claudia Göbel, “Open Science and Citizen Science als symbiotische 
Beziehung? Eine Gegeniiberstellung von Konzepten,” TATuP. Zeitschrift fiir Technikfolgenab- 
schätzung in Theorie und Praxis 26/1-2 (2017): 18-24, doi: 10.14512/tatup.26.1-2.18. 

6 Cf. Rick Bonney et al., “Next Steps for Citizen Science,” Science 343/6178 (2014): 1436-1437, 
doi: 10.1126/science.1251554. 

7 Cf. Tobias Füchslin, “What are you folding for? Nutzungsmotive von Citizen Science Online 
Games und ihre Lerneffekte,” merzWissenschaft - Magazine for Medienpädagogik (2016): 110- 
122, doi: 10.5167/uzh-131685. 

8 The consortium of Citizens Create Knowledge is funded by the German Federal Ministry for 
Education and Research (BMBF) and coordinated by the Museum of Natural History Berlin - 
Leibniz Institute for Evolution and Biodiversity Research (MfN), as well as the Helmholtz Centre 
for Environmental Research (UFZ). 

9 Cf. authors such as Karen Bruhn, Thorge Petersen and Swantje Piotrowski, “Offen, vernetzt 
und grenzenlos. Zu den Chancen und Potentialen der Digital Humanities in der Region- 
algeschichte,” in Regionalgeschichte. Potentiale des historischen Raumbezugs, ed. Nina von Gal- 
lion et al. (Göttingen: Vandenhoeck & Ruprecht, 2021); Andrea Stieldorf, “Geschichtsvereine: 
Ihre Bedeutung für die Landesgeschichte,” in Landesgeschichte und public history, ed. Arnd 
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and potentials of the digitally based citizen science approaches have only been 
explored in a rudimentary way in the humanities and especially the historical 
sciences. This situation requires further systematic methodical-epistemological 
reflection and an interdisciplinary exchange.'® In addition, this finding applies 
to the definition of citizen science as it is also formulated in the GEWISS Consor- 
tium’s Green Paper on Citizen Science Strategy 2020. According to this paper, 
citizen science is understood in the broader sense as the participation of the 
(non-expert) public in the various phases of the scientific work process under 
adherence to scientific standards." This approach addresses every degree in the 
participation of citizens engaged outside of the university. These can range 
from cooperation, collaboration and co-production as the most frequent forms 
of participation (data collection and processing) to active participation in the 
research process in the sense of its co-design (inclusion in the development of 
research questions and data evaluation).’” In the ultimately highly differenti- 
ated citizen science practice of historically oriented research institutes, profes- 
sional societies, associations/organisations and collection-holding institutions, 
citizen science projects are primarily found in the fields of archaeology, preser- 
vation of historical monuments, genealogy, local and regional history, philately 
and even art history, cultural history and the history of knowledge. In the sense 
of crowdsourcing, the most frequent possibilities for participation in various ar- 
eas of the research process are the provision of historical sources (for example 
Europeana 1914-1918"), image and text classification (for example Artigo” and 


Reitemeier (Ostfildern: Thorbecke, 2020), 103-112. Also see Thorsten Hoppe-Hartmann, “Citi- 
zen Science - Ein neues Konzept fiir die Geschichtswissenschaft oder ein alter Hut?”, #histo- 
risierend. Karls Geschichte(n), Last update on 26/09/2018, https://geschichten.hypotheses.org/ 
48, accessed July 20, 2021. 

10 A collected volume called Citizen Science in the Geschichtswissenschaften on this topic is in 
preparation. It will be published in 2022 in the open access series DH&CS. Schriften des Netz- 
werks fiir digitale Geisteswissenschaften und Citizen Science. 

11 “Citizen science describes the participation of persons in scientific processes without being 
bound to this area of science through an institution. This participation may include the short- 
term collection of data and range up to an intensive investment of leisure time to become more 
deeply absorbed in a research topic together with scientists and/or other volunteers. [...] The 
important factor is [...] the adherence to scientific standards, which primarily means trans- 
parency with regard to the methods of data collection and public discussions of the results.” 
Cf. GEWISS, Grünbuch Citizen Science Strategie 2020 (Berlin: Bürger schaffen Wissen — Wissen 
schafft Biirger project, 2016), 13. urn:nbn:de:101:1-20160621985. (Translated by the authors). 
12 Cf. Melissa V. Eitzel et al., “Citizen Science Terminology Matters: Exploring Key Terms,” 
Citizen Science: Theory and Practice 2/1 (2017): 1, doi: 10.5334/cstp.96. 

13 Europeana 1914-1918, http://europeana1914-1918.eu/. 

14 Artigo, https://www.artigo.org/. 
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Tag.Check.Score’’), transcription and annotation work (for example Transcribe 
Bentham, Transcribe Europeana 1914-1918, e-manuscripta or Letters 1916- 
1923!°), as well as further forms of evaluation processes for historical collections 
and data (for example the provision of contemporary historical knowledge in 
the form of eyewitness interviews). 

Against this outlined background and in view of the currently existing em- 
pirical findings from ongoing historically oriented citizen science projects, the 
article asks about the potential of citizen science as a method within the digital 
historical sciences and explores the challenges and possible boundaries of this 
approach in historical research. At the same time, the viability of citizen science 
approaches that extend beyond crowdsourcing is subjected to debate with the 
functional conditions of humanistic citizen science communication. A special 
focus is directed towards the conceptual questions regarding cooperation, inter- 
action and the negotiation of roles between the individual actors (community 
building, expectations and the culture of appreciation). The basis for these con- 
siderations is the example of an interdisciplinary project that is establishing a 
cross-project citizen science platform for the humanities and has been located 
at the University of Erfurt since 2019. Within the scope of the pilot project on 
the everyday history of the GDR, Kino in der DDR - Rezeptionsgeschichte “von 
unten” Y, a modular infrastructure is being developed that can be applied to 
various project contexts and very specific questions. In terms of the methodol- 
ogy, the approaches of digital humanities and citizen science, as well as the 
specialised methods of communication science, computer science and historical 
sciences are intertwined. 


15 Fraunhofer, https://www.fokus.fraunhofer.de/go/tag_check_score, accessed July 20, 2021. 
16 Transcribe Bentham, https://blogs.ucl.ac.uk/transcribe-bentham/, Transcribathon, 
https://transcribathon.com/en/, https://www.e-manuscripta.ch/, Letters 1916-1923, 
http://letters1916.maynoothuniversity.ie/. 

17 The project is funded from 2019 to 2022 by the Thiiringer Aufbaubank. Cf. https://projekte. 
uni-erfurt.de/ddr-kino, accessed July 20, 2021. Hendrikje Carius, Christiane Kuller, Patrick 
Rössler and René Smolarski, “Development of a Cross-Project Citizen Science Platform for 
the Humanities,” in Digital Humanities Austria 2018: Empowering Researchers, ed. Marlene 
Ernst et al., 79-82, doi: 10.1553/dha-proceedings2018s79. 
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2 “The wisdom of the many”: Potentials of 
research with citizen participation in the 
historical sciences 


The potentials of citizen science and especially the crowdsourcing-based ap- 
proaches have already been worked out for the humanities and social sciences 
from various sides.!8 The emphasis here is always on the cooperation of institu- 
tionalised and non-institutionalised science offering an added value for both 
the scientific participants and public concerns and concrete application is- 
sues.” This also applies to historical research. 

From the viewpoint of university-based historical sciences, the integration 
of an interested non-institutionalised public into the scientific process at vari- 
ous levels of citizen scientist participation — from crowdsourcing to citizen sci- 
ence — promises not only an integration of previously inaccessible historical 
source material? or analysis, organisation and transcription, but also the cre- 
ation of new research perspectives and interdisciplinary problem-solving ap- 
proaches.”! 

In the case of the “Cinema in the GDR” project currently conducted at the 
University of Erfurt, the focus is primarily on what Peter Finke somewhat pejo- 
ratively called “citizen science light””, which primarily refers to various crowd- 


18 A summary can be found in Claudia Göbel, Justus Henkel and Sylvi Mauermeister, Kultur 
und Gesellschaft gemeinsam erforschen. Uberblick und Handlungsoptionen zu Citizen Science in 
den Geistes- und Sozialwissenschaften (Halle-Wittenberg: Institute for Higher Education Rese- 
arch (HoF) at the Martin Luther University of Halle-Wittenberg, 2020, 25-29). 

19 Cf. Göbel, Henkel and Mauermeister, Kultur, 25. 

20 In addition to the project “Cinema in the GDR” discussed here, main examples can be 
found in the area of philately: The philatelic source material upon which it is based generally 
only exist outside of the university research landscape and requires their own source-specific 
methodical approaches. For more information see Pierre Smolarski and René Smolarski, “Wis- 
senschaftliches Stiefkind und amateurhafte Liebhaberei: Die Philatelie als historische Grund- 
wissenschaft,” in Die Historischen Grundwissenschaften heute. Tradition - Methodische Vielfalt - 
Neuorientierung, ed. Etienne Doublier, Daniela Schulz and Dominik Trump, 95-119 (Köln/Wei- 
mar/Wien: Böhlau, 2020). 

21 Cf. Oswald and Smolarski, “Einführung”, 14. An example of the social science perspective 
is Stefan Thomas, Susan Schröder and David Scheller, “Citizen Social Science — das Research 
Forum als partizipative Forschungsmethodik”, in Forschendes Lernen — Lernendes Forschen: 
partizipative Empirie in Erziehungs- und Sozialwissenschaften, ed. Sandra Eck (Weinheim/Basel: 
Beltz Juventa, 2019), 103-115. 

22 Peter Finke, Citizen Science. Das unterschätzte Wissen der Laien (München: oekom, 2014), 
41. 
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sourcing concepts. On the one hand, these include the availability and utilisa- 
tion of previously unconsidered source materials — in this case, primarily con- 
temporary images and press material from cinema buildings and cinema 
events — as well as the compilation of concrete data on the various types of cin- 
ema and film screening venues that were actively used in the territory of the for- 
mer GDR between 1949 and 1990 (see Figure 1). 


Fig. 1: Cinema locations recorded by the citizen scientists on the project page of “Cinema in 
the GDR” on the Citizen Science Platform (COSE) - status as of 31 May 2021. 


Beyond these crowdsourcing components, the integration of non-institutional 
scientists also promises further potential for historical research in that accessi- 
bility, visibility and popularity of the respective research fields are increased 
through the high-profile implementation of digitally supported citizen science 
projects in particular. Citizen science is therefore always associated with the 
public communication of science. As already indicated, it is connected with the 
field of public history in the area of historical sciences as a result.” 

This public dimension of citizen science projects in particular offers the citi- 
zen scientists involved a high added value that extends beyond the mere “joy of 


23 Cf. Ren& Smolarski and Sina Speit, “Was kann Public Interest Design aus Sicht der 
Geschichtswissenschaften sein?”, in Was ist Public Interest Design?, ed. Christoph Rodatz 
and Pierre Smolarski (Bielefeld: transcript, 2018), 95-112. 
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participating”™. Especially participation in essentially historical sciences 


projects, which often meet with a great response from the public, promotes a 
critical approach to sources and better understanding for the complexity of so- 
cial changes due to the accompanying teaching of methodical and theoretical 
competences.” Consequently, the public’s increased involvement beyond the 
realm of just crowdsourcing can also contribute to an examination of values 
and norms in society. Above all, this means strengthening the social relevance 
of humanistic and/or historical knowledge beyond the boundaries of univer- 
sity-based historical science.”’ 

Furthermore, the communication of science in citizen science projects is 
not unidirectional. Instead, the university partners also receive direct feedback 
on their research questions and are sometimes confronted with critical ques- 
tions that broaden their view of the topics that they are working on and may 
possibly even open up new perspectives.?® For example, it also became appar- 
ent within the scope of the “Cinema in the GDR” project that certain aspects of 
the cinema in the GDR’s everyday history — such as the inclusion of film screen- 
ing facilities at the companies and in the areas of the NVA (Nationale Volks- 
armee) had not been considered in the original concept of the project. Due to 
feedback from citizen scientists, it was possible to integrate these points into 
the course of the project. 

Finally, the long-term positive effects of an intensified cooperation between 
university and non-university historical research should be mentioned here. Af- 
ter all, there is also hope for more sustainability and a younger generation for 
volunteer work and regional historical research beyond the direct added value 
for the individual projects. This occurs primarily through the networking of uni- 
versity historical research with the communities that work digitally such as the 
Verein fiir Computergenealogie (Association for Computer Genealogy, Comp- 
Gen) and the various working groups under the umbrella of the Bund Deutscher 
Philatelisten (German Philatelic Association, BDPh). 

Beyond mere crowdsourcing, the narratives associated with historical docu- 
ments in society can also be addressed and the related issues and methodical 


24 Sonja Bettel, “Forschung zum Mitmachen”, upgrade 1 (2016): 35. 

25 Cf. Oswald and Smolarski, “Einführung”, 10. 

26 Cf. Peter Finke, “Citizen Science und die Rolle der Geisteswissenschaften fiir die Zukunft 
der Wissenschaftsdebatte. Citizen Science in Kultur und Geisteswissenschaften”, in Oswald 
and Smolarski (eds.), Biirger Kiinste Wissenschaft, 32. 

27 Cf. Göbel, Henkel and Mauermeister, Kultur, 26, 60. 

28 Cf. Friederike Hendriks and Doris Niederhoff, “Was haben Wissenschaftler von Wis- 
senschaftskommunikation? - Eine Interviewstudie” (article presented at the 10th Forum on 
Science Communication, Science in Dialogue, Braunschweig, 2017). 
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considerations integrated into the research as a result. This approach is espe- 
cially relevant for the pilot project on GDR history since the legitimacy and 
recognition of different narratives is currently the subject of a debate that is par- 
ticularly rife with conflict. The insights gained from the reflection on the dia- 
logue between the scientific discipline and the social public are further devel- 
oped within the project community on an interdisciplinary basis and flow into 
the technological and infrastructural implementations of the citizen science 
platform. 


3 Digital project meets non-digital community: 
Challenges of a digital citizen science in the 
historical sciences 


In addition to the added value and potentials of citizen science for science in 
general and the historical sciences in particular, the project initiators are also 
confronted with various challenges that must be taken into consideration when 
implementing the corresponding formats. For example, the citizen science ap- 
proach is not quite uncontroversial in the academic discourse. In particular, 
critical voices question the potential attributed to it and are doubtful about its 
scientific usability and the quality of data collected with the help of lay re- 
searchers.” 

From the perspective of science, the question about the efficiency and effec- 
tiveness of inclusive citizen research also arises.” The integration of an inter- 
ested public in the research process means considerable extra effort for the 
project collaborators. A mostly very heterogeneous group of citizen scientists 
must be acquired in a way that is effective for the public and appropriate for the 
target group, as well as motivated for the duration of the project. This requires a 
high degree of interaction between the scientists and the citizens. Lacking or 
inadequate communication, but also expectations that are too high on both 
sides, of science and lay researchers, can have a negative effect on the coopera- 
tion. 


29 Cf. Finke, Citizen Science. Das unterschdtzte Wissen der Laien, 17. 

30 Cf. Nina Wicke, “Citizen Science - eine ‘erfolgreiche’ Entwicklung in der Wissenschafts- 
kommunikation?,” in Intention und Rezeption von Wissenschaftskommunikation, ed. Jutta Milde 
et al. (Köln: Herbert von Halem Verlag, 2021), 179. 
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In the critical discussion with citizen science, there are also complaints that 
the scientific debate has not yet extended beyond the abstract goal of public en- 
gagement with science*! and that there is a lack of concrete methods and guide- 
lines on how a higher degree of participation and dialogue between the public 
and science could be achieved or even what the terms of participation and en- 
gagement actually mean.” In addition, citizen science projects are also increas- 
ingly taking place on the internet in the course of technological change”, and 
this also results in new requirements for a digital science communication — the 
use and impact of which has hardly been researched to date.” 

In view of the above-mentioned problem areas, the initiators of the “Cinema 
in the GDR” citizen science project also faced various challenges on multiple 
levels. Based on the main research question of reconstructing an everyday his- 
tory of the motion picture in the GDR, the project is primarily aimed at persons 
who were socialised in the former GDR and who have conscious memories of 
cinema experiences in the GDR or can provide evidence relevant to the research 
such as diaries, programme booklets or photographs. In view of the resulting 
age structure of the citizens to be involved in the research process and the 
project’s chosen digital access via a virtual research environment, this requires 
a specific communication strategy that incorporates both non-digital and digital 
channels of knowledge and science communication.” 

With regard to the design of the media offers, deliberate attention was paid 
to science communication that is appropriate for the target audience. This is 
based not only on the media usage behaviour of the target group to be 
reached,” but also relies on corresponding openly, dialogue and participation- 
oriented formats in accordance with the requirements of the GEWISS Consor- 
tium.” For the first time, a non-university public was incorporated into the 


31 Cf. Stilgoe, Lock and Wilsdon, “Public Engagement with Science”, 4-11. 

32 Cf. Fahnrich, “Wissenschaftsevents”, 172-177. 

33 Cf. Füchslin, “Nutzungsmotive”, 110-111. 

34 Cf. GEWISS, Grünbuch Citizen Science Strategie 2020, 24. 

35 Cf. Anna-Rosa Haumann and Ren& Smolarski, “Digital project meets analog community. 
Expectations and experience of a digital citizen science project on GDR history,” in Austrian 
Citizen Science Conference 2020. 14-16 September 2020. Conference Proceedings (2021), acces- 
sed July 20, 2021, https://pos.sissa.it/393/010/pdf. 

36 The starting point for the online usage behaviour of the target groups to be addressed was 
formed by the results of the ARD/ZDF online study on the use of classes on the internet, as well 
as social media offers in the age groups of 50 years and above; cf. Natalie Beisch, Wolfgang 
Koch and Carmen Schäfer, “ARD/ZDF-Onlinestudie 2019: Mediale Internetnutzung und Video- 
on-Demand gewinnen weiter an Bedeutung,” Media Perspektiven 9 (2019): 382-383. 

37 Cf. GEWISS, Grünbuch Citizen Science Strategie 2020, 24. 
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project activities just shortly after the research project’s start in November 2019. 
This occurred in the form of a kick-off event in Erfurt with the aim of specifically 
stimulating the exchange between scientists and interested citizens. Within this 
context, a survey was conducted among the participants to identify further po- 
tentials for supporting the project communication. About one-third (32 percent) 
of the respondents wanted to have additional (on-site) events within the scope 
of the research project, and another 32 percent wished to be informed about the 
progress of the project by means of newsletters. About one-fifth of the respon- 
dents (22 percent) indicated that they wanted to use the project website as an 
information platform, in contrast with the nine percent who opted for social me- 
dia, for example Twitter or Facebook.*® 

Although the collected data is by no means representative, it shows that the 
adopted strategy of covering a relatively broad spectrum of communication of- 
fered in online and offline areas appears to be quite necessary and expedient. 
In addition to the classic channels of science communication such as press rela- 
tions, events and workshops, this also includes online activities such as posts 
on Twitter and Facebook and preparing a blog to accompany the project”. The 
latter already went online in October 2019, almost one year before the launch of 
the technical citizen science platform, in order to draw the attention of an inter- 
ested public to the project at any early stage. Since then, the blog has been up- 
dated with new content on a regular basis. Among other things, it provides help 
on how to use the platform, information on events and historical contributions 
to the GDR’s history of cinema and film. In addition, interim results of the 
project are published on the blog and it offers citizen scientists the possibility of 
presenting their own research findings or eyewitness accounts. The project’s 
Twitter and Facebook channels make it possible to share the corresponding 
blog contributions with the community and successively expand the network of 
interested lay researchers. The offers initiated by the project leaders are aimed 
not only at potential citizen scientists, but also at possible multipliers of profes- 
sional media work and existing citizen science communities in the German- 


38 The brief survey was conducted during the kick-off event of the “Cinema in the GDR” 
project on 16™ November 2019 in Erfurt. The original question was: “Through which channels 
would you prefer to stay in contact with the project? (multiple answers possible)” and got 
responses from 26 participants. 

39 “Cinema in the GDR” project blog, University of Erfurt, https://projekte.uni-erfurt.de/ddr- 
kino/. 
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speaking countries (above all: Bürger schaffen Wissen“, Österreich forscht“, 
Schweiz forscht*’). 

Through its communication activities to date, the “Cinema in the GDR” citi- 
zen scientist platform has been able to register around 120 citizen scientists 
since its online launch in October 2020. They have made around 400 cinema 
entries as a group (status as of July 2021). In addition, there have been more 
than 70 inquiries by interested citizens who would like to contribute to the 
project as contemporary witnesses outside of the online platform. These include 
not only cinema-goers, but also projectionists, cashiers, cinema owners and 
filmmakers from the former GDR. 

In order to further investigate the limits and possibilities of the digitally 
based citizen science approaches, it is necessary to increasingly evaluate corres- 
ponding formats. With regard to the “Cinema in the GDR” project, the initiators 
selected a evaluation process that accompanies the project. Through all project 
phases, it documents and analyses the viewpoints of both the project leaders 
and the citizen scientists. In addition to the direct feedback rounds on events 
and on the citizen science platform, this also includes quantitative and qualita- 
tive surveys, informal and formal discussion rounds with participants, as well 
as the letters submitted. Finally, by means of a systematic processing of the ma- 
terial, the objective is to examine to what extent the participatory “Cinema in 
the GDR” project can produce reliable results and whether the set expectations 
on the part of the scientists and lay researchers can be fulfilled. 


4 Perspectives of digitally based citizen science 
approaches for the historical sciences 


Digitally based citizen science approaches that go beyond crowdsourcing and 
involve the public in the scientific process appear to be quite interesting ap- 
proaches for the historical sciences, based on the collected experiences in 
projects such as “Cinema in the GDR” or in other areas such as philately“. How- 
ever, a number of questions still need to be discussed for the localisation and 
perspective of citizen science in historical research. On the one hand, these are 


40 Biirger schaffen Wissen, https://www.buergerschaffenwissen.de. 

41 Osterreich forscht, https://www.citizen-science.at. 

42 Schweiz forscht, https://www.schweizforscht.ch/. 

43 Cf. Pierre Smolarski, René Smolarski and Silke Vetter-Schultheiss, ed., Gezähnte Geschichte. 
Die Briefmarke als historische Quelle (Göttingen: V&R unipress, 2019). 
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related to conceptual topics such as the interaction and negotiation of various 
roles between the actors involved (community building, expectations and cul- 
ture of recognition) and the existing cooperation possibilities. On the other 
hand, these also relate to basic ethical-legal conditions. Moreover, discussion is 
required on what possibilities the existing research landscape offers at all for 
stimulating an interested public to systematically develop its own citizen scien- 
tist projects and/or develop its own historical questions on the source material 
acquired in the crowdsourcing projects. In addition, there is a need for a funda- 
mental understanding of the premises along which digital infrastructures are 
conceptualised and implemented for citizen science projects. This also applies 
to the inclusion of citizen scientists in the development of not only historical 
questions but also the citizen science tools themselves. The design of digital in- 
frastructures for citizen science projects is closely associated with the solutions 
generally required in digital historical sciences such as ensuring data quality 
and curation or generally considering FAIR data principles.‘* Interface design 
and user guidance require continuous processes of review and iterative devel- 
opment. If these components of digital citizen science infrastructure aim at a 
hermeneutically reflective reduction of complexity in the practice, the develop- 
ment of data literacy competences of all actors in digital citizen science is ex- 
tremely essential. Further-reaching perspectives such as these may then provide 
the connecting links for actually establishing a structural change in the histori- 
cal sciences with the systematic integration of citizens. 
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Mareike Konig und Paul Ramisch 
Die twitternde Zunft 


Historikertage auf Twitter (2012-2018) 


Abstract: This article presents different perspectives on a corpus of tweets pub- 
lished under the respective conference hashtags during the four Historikertage 
from 2012 to 2018. The focus of the research is on Twitter practices and their 
development, the content of the tweets as well as networks of the tweeting his- 
torians in an academic conference situation over six years. For the first time, 
the historian community is subject of a Twitter study. Special features of the 
study are the relatively long period of time compared to other analyses, which 
is examined selectively on the basis of the Historikertage, as well as gender-spe- 
cific evaluations made possible by open coding. 


Keywords: historical research, Twitter, conference, Historikertag, content analy- 
sis, network analysis, digital methods 


Zusammenfassung: Dieser Beitrag zeigt verschiedene Perspektiven auf ein Kor- 
pus von Tweets, die unter den jeweiligen Konferenz-Hashtags anlässlich der 
vier Historikertage von 2012 bis 2018 publiziert wurden. Im Mittelpunkt des Er- 
kenntnisinteresses stehen Twitterpraktiken und ihre Entwicklung, Inhalte der 
Tweets sowie Netzwerke der twitternden historischen Zunft in einer wissen- 
schaftlichen Tagungssituation über sechs Jahre hinweg. Erstmals wird damit in 
einer Twitterstudie die historische Fachcommunity in den Blick genommen. Be- 
sonderheiten der Studie sind der im Vergleich zu anderen Analysen verhältnis- 
mäßig lange Zeitraum, der punktuell anhand der Historikertage untersucht 
wird, sowie genderspezifische Auswertungen, die durch eine offene Kodierung 
ermöglicht werden. 


Schlagwörter: Geschichtswissenschaft, Twitter, Tagung, Historikertag, Inhalts- 
analyse, Netzwerkanalyse, digitale Methoden 


Der alle zwei Jahre an wechselnden Orten stattfindende Historikertag ist mit 
durchschnittlich rund 3500 Teilnehmenden einer der größten geisteswissen- 
schaftlichen Kongresse in Europa. Die Tagung gilt als zentraler Ort der Zunft, 
an dem medien- und breitenwirksam Diskussionen geführt werden, die das 


8 Open Access. © 2022 Mareike König und Paul Ramisch, published by De Gruyter. IEE Dieses Werk 
ist lizensiert unter einer Creative Commons Namensnennung 4.0 International Lizenz. 
https://doi.org/10.1515/9783110757101-017 
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Fach in seinen inhaltlichen Ausrichtungen genauso prägen wie sein Bild in der 
Öffentlichkeit. Diskussion und Austausch stehen bei diesem Versammlungsfor- 
mat im Mittelpunkt, wozu Sektionen, Einzelvorträge, Podiumsdiskussionen und 
Posterpräsentationen sowie — nicht weniger wichtig — Kaffeepausen und andere 
soziale Events gehören. 

Als zusätzliche Austauschplattform sind für die „versammelte Zunft“! seit 
den 2010er Jahren soziale Medien hinzugekommen, unter denen der Kurznach- 
richtendienst Twitter (seit März 2006) eine besondere Rolle einnimmt.’ Twittern- 
de Tagungsteilnehmende publizieren in Echtzeit Kommentare und Eindrücke 
von der Tagung, diskutieren miteinander, posten Fotos und Links auf weiter- 
führende Informationen und verabreden sich auf einen Kaffee oder ein „Twit- 
tagessen“ in den Pausen. Als kommunikativer „Rückkanal“? ermöglicht Twitter 
die Partizipation der Zuhörer:innen und einen unmittelbaren Austausch, ohne 
laufende Vorträge zu stören. Dabei können auch Personen, die nicht physisch 
anwesend sind, interaktiv eingebunden werden. 

Dieser Beitrag zeigt verschiedene Perspektiven auf ein Korpus von Tweets, 
die unter den jeweiligen Konferenz-Hashtags anlässlich der vier Historikertage 
von 2012 bis 2018 publiziert wurden. Im Mittelpunkt des Erkenntnisinteresses 
stehen Twitterpraktiken und ihre Entwicklung, Inhalte der Tweets sowie Netz- 
werke der twitternden historischen Zunft in einer wissenschaftlichen Tagungs- 
situation über sechs Jahre hinweg.” 


1 Matthias Berg et al., Die versammelte Zunft. Historikerverband und Historikertage in Deutsch- 
land 1893-2000 (Göttingen: Wallstein, 2018). 

2 Zu Twitter und seiner Entwicklung siehe Jean Burgess und Nancy K. Baym, Twitter: A Bio- 
graphy (New York: New York University Press, 2020). Allgemein zu sozialen Medien in der Wis- 
senschaft: Mareike König, „Scholarly Communication in Social Media,“ in Science Communica- 
tion. Handbook of Communication Sciences HoCS, 17, hg. v. Annette Leßmannmöller et al. (Mün- 
chen: De Gruyter, 2020), 639-656. 

3 Claire Ross et al., „Enabled Backchannel: Conference Twitter Use by Digital Humanists,“ 
Journal of Documentation 67 (2011): 214-237. 

4 Präsentiert wird hier eine Auswahl an Ergebnissen. Eine vertiefte Darstellung der Methoden, 
rechtliche und ethische Überlegungen, weitere kommentierte Abbildungen und Graphen sowie 
die IDs der Tweets sind bei Zenodo, der Code bei GitHub hinterlegt, siehe: Mareike König und 
Paul Ramisch, Historikertage auf Twitter (2012-2018). Datenreport und Datenset, Zenodo 2022. 
doi: 10.5281/zenodo.6362301. 
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1 Vorgehensweise, Methoden und Grenzen der 
Studie 


Daten aus sozialen Medien sind eine neuere Quellengattung, die seit mehreren 
Jahren eine starke Forschungsdynamik in verschiedenen Disziplinen ausgelöst 
haben.’ Aufgrund der relativ leicht zugänglichen Daten gehört Twitter dabei zu 
den am häufigsten untersuchten Plattformen.® Ein beliebter Forschungsgegen- 
stand im Bereich der wissenschaftlichen Nutzung von Twitter ist das Konfe- 
renztwittern.’ Die Untersuchungen zeigen unter anderem, dass sich Twitter- 
praktiken in den Disziplinen unterscheiden. In unserer Studie wird erstmals 
die historische Fachcommunity in den Blick genommen. 

Bei der Arbeit mit Daten aus sozialen Medien stellen sich verschiedene Her- 
ausforderungen, zum Beispiel methodische Fragen beim Umgang mit großen 
Mengen an proprietären Daten, Kürze und Spezialjargon der Postings, Vielfalt 
und Komplexität der Inhalte sowie ethische und rechtliche Fragen im Hinblick 
auf das Sammeln, Aggregieren und das Wiedergeben von Inhalten und Metada- 
ten.’ Für die vorliegende Studie wurden zitierte Tweets von Einzelpersonen an- 
onymisiert, die Kommunikation der offiziellen Accounts von Einrichtungen da- 


5 Siehe die Forschungsübersicht in Lori McCay-Peet und Anabel Quan-Haase, „What is Social 
Media and What Questions Can Social Media Research Help Us Answer?,“ in The SAGE Hand- 
book of Social Media Research Methods, hg. v. Luke Sloan und Anabel Quan-Haase (London: 
Sage Publications, 2017), 13-26. 

6 Übersichten zu Methoden speziell bei Twitteranalysen zum Beispiel Manuel Burghardt, „In- 
troduction to Tools and Methods for the Analysis of Twitter Data,“ Media Linguistics 1 (2015): 
74-91; Michael Zimmer und Nicholas John Proferes, „A Topology of Twitter Research: Discipli- 
nes, Methods, and Ethics,“ Aslib. Journal of Information Management 66/3 (2014): 250-261. 

7 Siehe zum Beispiel B. Hilary Smith Risser und Glenn Waddell, „Beyond the Backchannel: 
Tweeting Patterns After Two Educational Conferences,“ Educational Media International 55/3 
(2018): 202; Royce Kimmons und George Veletsianos, „Education Scholars’ Evolving Uses of 
Twitter as a Conference Backchannel and Social Commentary Platform,“ British Journal of Edu- 
cational Technology 47/3 (2016): 445-464. Eine Übersicht dazu auch bei Merja Mahrt et al., 
„Twitter in Scholarly Communication,“ in Twitter and Society, hg. v. Katrin Weller et al. 
(New York: Peter Lang, 2014), 202-205. 

8 Vgl. zum Beispiel B. Kim Holmberg und Mike Thelwall, „Disciplinary Differences in Twitter 
Scholarly Communication,“ Scientometrics 2 (2014): 1027-1042; Mahrt et al., „Twitter in Scho- 
larly Communication,“ 204. 

9 Zu rechtlichen und ethischen Fragen siehe Michael Beurskens, „Legal Aspects of Twitter 
Research,“ in Twitter and Society, hg. v. Weller et al., 123-133; Matthew L. Williams et al., 
„Towards an Ethical Framework for Publishing Twitter Data in Social Research: Taking into 
Account Users’ Views, Online Context and Algorithmic Estimation,“ Sociology 51/6 (2017): 
1149-1168. 
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gegen offen genannt.” Eine Schwierigkeit stellten die technischen Entwicklun- 
gen bei Twitter seit 2012 dar, etwa die Verdoppelung der erlaubten Zeichenzahl 
pro Tweet im November 2017 auf 280 Zeichen sowie das Einführen von Retweets 
und Tweets als Zitate und damit das Sperren des Originaltweets für Änderungen 
beim Retweeten. 

Das hier untersuchte Gesamtkorpus der Tweets stammt aus auf verschiede- 
nen Wegen erstellten Teilkorpora (Tweetsammlungen über das Tool TAGS" so- 
wie über die Twitter Premium API”? mithilfe des RTweet-Packages in der Pro- 
grammiersprache R beziehungsweise RSudio abgerufene Tweets). Diese wurden 
zusammengeführt und aufbereitet, um eine kohärente Datenbasis für die weite- 
ren Analysen zu erhalten. Die unterschiedliche Erstellung der Korpora führt ge- 
nau wie die erwähnten technischen Entwicklungen bei Twitter dazu, dass die 
Datenqualität teilweise variiert. Für diese Studie grundlegend ist zudem, dass 
ausschließlich Tweets berücksichtigt wurden, für die der Tagungshashtag der 
Historikertage und die Schreibvarianten verwendet wurden, also #histag, #hist- 
tag und #historikertag mit den jeweiligen Jahren in den Formaten 2018 und 18 
angehängt. Dies dient dazu, die Studie auf die twitternde Zunft zu beschränken, 
die mit den Gepflogenheiten des Tagungshashtags vertraut ist, und nicht alle 
Tweets mit dem Wort „Historikertag“ in das Korpus aufzunehmen. Allerdings 
können dadurch relevante Tweets fehlen, bei denen der Tagungshashtag weg- 
gelassen wurde, sei es absichtlich oder aus Versehen: etwa wenn nur spezifi- 
sche Sektionshashtags verwendet wurden oder wenn in Unterhaltungen oder 
bei sehr kritischen Tweets der Tagungshashtag weggelassen wurde, um einem 
Tweet weniger Sichtbarkeit zu geben und ihn nur mit der eigenen Follo- 
werschaft zu teilen." 

In einem weiteren Schritt wurde das Twitterkorpus in mehreren Durchgän- 
gen und von mehreren Personen manuell kodiert. Kodierungen haben den 
Vorteil, für maschinelle Analysen vorzubereiten, ohne in den Datensatz einzu- 
greifen. Sie sind jedoch anfällig für Uneinheitlichkeit bei der Vergabe der 


10 Zu den rechtlichen und ethischen Überlegungen König und Ramisch, Historikertage auf 
Twitter. 

11 TAGS - Twitter Archiving Google Sheet, https://tags.hawksey.info/about/. 

12 Zu den beiden vorhandenen API, ihren Möglichkeiten und Beschränkungen siehe Burg- 
hardt, „Introduction,“ 79. 

13 Zu den Vor- und Nachteilen von Hashtag-Korpora gegenüber Stichwort-Korpora siehe Axel 
Bruns und Stefan Stieglitz, „Metrics for Understanding Communication on Twitter,“ in Twitter 
and Society, hg. v. Weller et al., 75. 

14 Wir bedanken uns herzlich bei Elena Suärez Cronauer, Friederike Odenwald und Helen 
Bubinger für die Mitarbeit an der offenen Kodierung. Das iterative Vorgehen bei der Kodierung 
ist im Datenreport beschrieben, siehe König und Ramisch, Historikertage auf Twitter. 
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Codes, zumal bei kurzen Tweettexten. Zum einen wurden die insgesamt 1970 
Accounts mit acht verschiedenen Gender- bzw. Typcodes kodiert (Mann, Frau, 
anonym, Einrichtung, Unternehmen, Zeitschriften, Bots, unbekannt). Zum an- 
deren wurden die insgesamt 14 207 Tweets einer von sieben Kategorien zugeord- 
net, die in erster Linie die Funktion der Tweets beschreibt und weniger die 
Tweetinhalte. Zwar wird durch die vorgegebene qualitative Kategorisierung 
die Funktion der Tweets nicht unmittelbar aus unseren Daten selbst abgeleitet. 
Sie orientiert sich jedoch an einer ähnlichen Studie, die 2009 über das Ta- 
gungstwittern in der Digital Humanities-Community durchgeführt wurde, und 
schafft somit die Möglichkeit zum Vergleich.'® 


Tab. 1: Übersicht der vergebenen Kategorien 


Code Bedeutung Beispiel 
1 Kommentar zu Vortrag oder Veran- #histag12 schöner Abschluss des Historiker- 
staltung tages mit einem runden Vortrag vom scheiden- 


den Vorsitzenden des VHD 


„Gespaltene Gesellschaft, was heißt das denn? 
Die Alternative wäre dann eine homogene Ge- 
sellschaft, die kann es nicht geben.“ Leise Kri- 
tik am Konferenztitel von #HisTag18 seitens 
Wolfgang Schäuble? 


2 Ressourcen und Links teilen Twitter als Recherchemittel: Folien https://t. 
co/GaFXDg1R2k und Pad https://t.co/hhYEuT 
DybR #histag16 #twitterlounge https://t.co/ 
V7LRgIFO6B 


Der Gärprozess hat einen offenen Brief an den 
@VHDtweets hervorgebracht: https: //t.co/ 
iULHZOQ4WL #HisTag18 #histocamptag 


3 Gespräch/Diskussion „@Twitteruser1: @Twitteruser2 Respekt. Dein 
Diss-Plakat ist echt nicht von schlechten El- 
tern! #histag12 http://t.co/2Z9QEAAA“ danke 


@Twitteruser1: @Twitteruser2 Dann braucht 
man aber auch Programmierer mit Grundver- 
ständnis für GW-Daten als Komplementär. 
#histag16 #digigw16 


15 Ross et al., „Backchannel,“ 219. 

16 Vgl. die Kritik solcher Studien bei Matthias Meiler, „Wissenschaftliches Twittern. Linguis- 
tische Bestandsaufnahme und method(olog)ische Auslotung, insbesondere mit Fokus auf Kon- 
ferenztweets“, Linguistik Online (2021): 87-111, doi: 10.13092/10.106.7511. 
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Tab. 1 (fortgesetzt) 


Code Bedeutung Beispiel 


4 Notizen machen »Wir haben ein Problem der Einflussnahme 
durch digitale Medien“, sagt Mergel als Aus- 
gang fiir zunehmenden Populismus #histag16 
#historydebate 


Objekte tragen Spuren ihrer Behandlung. Be- 

hältnisse und Installationen zeigen Lokalisie- 

rung in Handlungskontexten #histmat14 #His- 
Tag14 


5 Onlinepräsenz gestalten/Werbung Nach rundum ertragreichem und inspirieren- 
(eigenes Panel, eigene Publikation) dem #histag12 wieder zuhause. Nächstes Mal 

nehme ich das richtige Ladekabel mit, um mit- 
zutwittern 
Erstaunlich viele Smartphones hier, ob die 
auch alle twittern? #HisTag14 

6 Organisatorisches und CfP Die aktuellsten PROGRAMMÄNDERUNGEN für 
den #HisTag14 sind online einsehbar: http://t. 
co/PQyrjAvKUU 
Leider fällt der Vortrag „Twitter als Recherche- 
mittel“ morgen in der #Twitterlounge um 14h 
wegen Erkrankung des Referenten aus #his- 
tag16 

7 Unklar #histag12 OK "si" natuerlich ... 
Und c p oob #histag16 jtp 


In einem weiteren Schritt wurden nach einer Datenvorbereitung für die Netz- 
werkanalyse mit der freien Software Gephi alle Twitter-Nutzer:innen und deren 
Follower:innen- und Friends-Verbindungen betrachtet, von denen mindestens 
ein Tweet im Korpus enthalten ist, die an das Netzwerk angebunden sind und 
deren Accounts weder gelöscht noch auf privat umgestellt wurden.” Und 
schließlich wurde eine inhaltliche Auswertung der Tweets mit dem webbasier- 
ten Dienst Voyant-Tools vorgenommen. Dabei wurde das Korpus nach der Da- 


17 Drei Gruppen von Accounts wurden ausgefiltert: gelöschte Accounts (51), Accounts, die auf 
privat gestellt wurden (18), und Accounts, denen weniger als zwei Accounts aus dem weiteren 
Netzwerk folgen (246, teils Überschneidung mit gelöschten/privaten Accounts). Diese Barriere 
hilft sicherzustellen, dass die betrachteten Akteur:innen tatsächlich in dieses Netzwerk einge- 
bunden sind. Somit untersuchen wir in der Netzwerkanalyse 1711 der insgesamt 1970 Accounts 
aus dem Korpus. 
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tenbereinigung!® auf der Wortebene analysiert und Worthäufigkeiten, chronolo- 
gische Frequenzgraphen und Kookkurenzen untersucht. Hier zeigen sich 
schnell die Grenzen einer rein digitalen Inhaltsanalyse angesichts der kaum 
überschaubaren Menge an höchst unterschiedlichen Einzeltweets. 


2 Twitterstorians und Praktiken der 
Twitternutzung 


Anhand des so vorbereiteten Tweetkorpus wurden statistische Auswertungen 
mit der Programmiersprache R vorgenommen. In der Gesamtschau lässt sich 
eine starke Zunahme der Anzahl an twitternden Historiker:innen seit 2012 beob- 
achten: Von 155 twitternden Accounts in Mainz 2012 stieg die Zahl der Twitter- 
storians auf 1045 Accounts beim Historikertag in Münster 2018 an (Abbildung 1 
und 2). Die Accountzahlen nahmen insbesondere bei Frauen deutlich zu, wobei 
in absoluten Zahlen die von Männern geführten Accounts 2018 nach wie vor 
überwiegen. Zu beachten ist, dass von den insgesamt 1970 Accounts die große 
Mehrheit (1282) selbst keine eigenen Originaltweets absetzte und nur deshalb 
Teil des Korpus sind, weil sie einen Tweet retweetet haben. 688 Accounts haben 
eigene Tweets gepostet, davon 392 mehr als einen. Insgesamt handelt es sich 
damit um einen spezifischen und kleinen Ausschnitt der Geschichtswissen- 
schaft, der sich auf Twitter äußert. Fine qualitative Einordnung der Accounts 
nach Karrierestufe (Studierende, Promovierende, Post-Docs, Professor:innen) 
ist nur manuell möglich, wobei für eine Auswertung der Zeitpunkt des Twitterns 
berücksichtigt werden müsste. Sie ist in dieser Studie daher nicht erfolgt. Mit 
Blick auf das Gesamtkorpus lässt sich zum Zeitpunkt der Auswertung 2021 sa- 
gen, dass von den beteiligten Accounts von Historiker:innen (709 zu 515) nur 
rund 30 Accounts von (Junior-)Professor:innen geführt werden. Rückläufig ist 
über den Untersuchungszeitraum die Anzahl der anonymen Accounts, deren 
Anteil sich von 15,5 % auf 8,4% fast halbiert. Ebenso wie die generell steigen- 
den Accountzahlen spricht dies für eine zunehmend bewusste und strategische 
Verwendung von Twitter als Mittel der Fachkommunikation innerhalb der Ge- 
schichtswissenschaft. 


18 Die Tweets wurden in Notepad++ für die Analysen vorbereitet, in dem Links, Accountna- 
men, Zahlen, Stoppwörter und anderes entfernt und häufige Wörter auf ihren Wortstamm zu- 
rückgeführt wurden. Außerdem wurde die Stoppwortliste in Voyant-Tools verwendet und ite- 
rativ angepasst. 
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Twitternde Accounts 


auf Basis des Kombinationskorpus, hier sind auch 
gelöschte Tweets berücksichtigt 


2012 2014 2016 2018 


Abb. 1: Entwicklung der Anzahl der twitternden Accounts, n = 1970 


Zusammensetzung der Twitter-Community bei den Historikertagen, 
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Abb. 2: Zusammensetzung der twitternden Accounts insgesamt 


Eine steigende Anzahl an twitternden Historiker:innen bedeutet nicht zugleich 
eine im vergleichbaren Umfang steigende Anzahl an Tweets während der Histo- 
rikertage, im Gegenteil: In absoluten Zahlen gehen diese nach einem starken 
Anstieg in Göttingen 2014 zurück und halbieren sich von dort bis Münster 2018 
(Abbildung 3). Bezieht man Retweets in die Analyse mit ein, verschiebt sich das 
Bild: Bei den Gesamttweets ist der Knickt erst 2016 zu sehen (Abbildung 4). 
Während die early adopters von Twitter in der Fachcommunity 2012 im Median 
rund zwei Tweets gepostet haben, war es 2018 im Median nur ein einzelner 
Tweet pro Account. Die Streuung ist dabei sehr groß: Einige Poweruser:innen 
haben verteilt über die vier Historikertage über 300 Tweets (inklusive Retweets) 
gepostet, so dass sich auch bei den Twitterstorians die für soziale Medien typi- 
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sche 90:9:1-Regel in Bezug auf die Produktion von Inhalten bestätigt.” Nur drei 
Accounts haben dabei insgesamt über 200 Originaltweets gepostet, elf über 
100.2 


Originaltweets 


auf Basis des API-Korpus, dadurch sind gelöschte 
Tweets nicht berücksichtigt 


2012 2014 2016 2018 


Gesamt-Tweets 


auf Basis des Kombinationskorpus, hier sind auch 
gelöschte Tweets berücksichtigt 


2012 2014 2016 2018 


Abb. 3 und 4: Entwicklung der Tweetzahlen: Originaltweets und Gesamttweets 
(Originaltweets und Retweets) 


Dennoch sind Historiker:innen während ihrer wichtigsten Tagung eine auf Twit- 
ter aktive Community, wie der Blick auf Retweets und Likes (bis November 2015: 


19 Demnach bleiben 90 % der Nutzer:innen eher passiv in den sozialen Medien, 9% posten ab 
und zu, während 1% für den Großteil der Inhalte verantwortlich ist. Bruns und Stieglitz schla- 
gen vor, Tweetkorpora nach diesen drei Gruppen aufgeteilt zu untersuchen, vgl. Bruns und 
Stieglitz, „Metrics,“ 74. 

20 Siehe die Zahlen nach Gruppen pro Historikertag bei König und Ramisch, Historikertage auf 
Twitter. 
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Favs) während der Kongresse zeigt. Beides sind „soziale Akte“. Doch während 
Likes privater Natur und weniger sichtbar”? sind und vor allem die Sympathie 
für den Inhalt eines Tweets anzeigen, gelten Retweets als bedeutendste Metrik, 
als Indikator für Resonanz und Aufmerksamkeit. Auffallend ist das Stagnieren 
der Retweets 2018 in absoluten Zahlen (Abbildung 5), was mit der niedrigeren 
Anzahl an Originaltweets zusammenhängen dürfte. Die Anzahl der Likes steigt 
dagegen fast konstant an (Abbildung 6). Während 2012 im Durchschnitt jeder 
Originaltweet zum Historikertag 0,9-mal favorisiert wurde, erhielten Original- 
tweets 2018 im Durchschnitt sieben Herzen. Mit Blick auf Retweets und Likes ist 
die Community an Twitterstorians über die Jahre also nicht passiver geworden, 
sie ist vielmehr anders aktiv. Die hohe Anzahl an Likes deutet darauf hin, dass 
die gesendeten Tweets gelesen werden und mit ihnen interagiert wird. Eine Hy- 
pothese ist, dass vor allem Likes, aber auch Retweets das Verfassen eigener 
Tweets in Teilen ersetzt haben. Erklärungen dafür liegen in den technischen Än- 
derungen bei Twitter begründet, denn sie lassen sich allgemein auf der Platt- 
form beobachten.” Zusätzlich könnte die größere Community und die steigende 
Anzahl an Follower:innen für mehr Sichtbarkeit der Tweets und damit auch für 
mehr Interaktion, aber auch einen höheren performativen Druck gesorgt haben. 
Dies und der spezielle soziale Kontext der Tagung könnte manche Twitterstori- 
ans besonders motiviert haben, einen Tweet zu produzieren, der häufig retwee- 
tet wird, während manche lieber die Ideen anderer verbreiten, als selbst zu twit- 
tern (siehe Abschnitt 6). 


Retweets 
auf Basis des API-Korpus, dadurch sind gelöschte 
Tweets nicht berücksichtigt 


2012 2014 2016 2018 


21 Johannes Paßmann, Die soziale Logik des Likes. Eine Twitter-Ethnografie (Frankfurt a.M.: 
Campus, 2018), 17. 

22 Burgess und Baym, Twitter, 101. 

23 Zur Entwicklung der Retweets vgl. ibid., 87, 92-97. 
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Abb. 5 und 6: Entwicklung der Retweets und Entwicklung der Likes 


Die Entwicklung der Originaltweets mit Erwähnungen eines anderen Accounts 
(Mentions) zeigt in absoluten Zahlen bis 2016 eine starke Zunahme, dann einen 
starken Rtickgang bis fast auf den Stand von 2012 (Abbildung 7). Die Kurve folgt 
aber nicht der Anzahl der Originaltweets, sondern schwankt bei den einzelnen 
Historikertagen, mit einem Höchststand 2012 von 38,8%. In der Regel erhalten 
neben offiziellen Veranstaltungsaccounts diejenigen die meisten Mentions und 
Antworten, die am häufigsten twittern,“ was sich auch in unserem Korpus 
zeigt. 


Originaltweets mit Mentions 
auf Basis des API-Korpus, dadurch sind gelöschte 
Tweets nicht berücksichtigt 
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Abb. 7: Entwicklung der Tweets mit Erwähnungen anderer Accounts in absoluten Zahlen 


Ein Blick auf die Antworten (Replies) im Korpus zeigt, dass diese in absoluten 
Zahlen wie prozentual gesehen zunehmen. Insgesamt haben 22,1% (1404) der 
Originaltweets mindestens eine Antwort bekommen, mindestens zwei Antwor- 


24 Smith Risser und Waddell, „Beyond the Backchannel,“ 202. 
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ten bekamen 5,6% (356) der Tweets. Der Höchststand ist dabei 2018 erreicht, 
als 29,7% der Tweets mindestens eine Antwort bekommen haben. Dies zeigt 
eine starke kommunikative Einstellung der twitternden Zunft während der His- 
torikertage. 


3 Funktionen der Tweets 


Welche Funktion haben die zu den Historikertagen geposteten Tweets? Die Er- 
gebnisse der Kodierung zeigen schwankende Zahlen bei den einzelnen Veran- 
staltungen (Abbildung 8), was nahe legt, dass hier - mit Ausnahme einiger 
Trends - weniger eine Entwicklung zu sehen ist, als kontextbezogenes Verhal- 
ten anlässlich der einzelnen Historikertage und ihrer spezifischen Dynamiken. 
Zu berücksichtigen ist außerdem die erwähnte Datenunsicherheit durch die ma- 
nuelle Kodierung. 

Zunächst zu den Trends: Bei allen vier Historikertagen zielten die Praktiken 
vor allem darauf, mit Tweets während der Tagung Notizen zu machen und Vor- 
träge und Diskussionsbeiträge damit zu verbreiten und zu dokumentieren (Ka- 
tegorie 4, blau). Diese Kategorie hält durchgängig über die Jahre den höchsten 
Anteil bei den Originaltweets, wobei dieser schwankt mit einem Tiefstwert von 
23,7% in 2012 und einem Höchstwert von 36,7% in 2014. Zum Vergleich die 
Zahlen aus der DH-Community 2009: Auch dort entfielen die meisten Tweets 
auf die Kategorie 4, sie erreichten sogar einen Anteil von 43 % am Gesamtkor- 
pus.” 

In diesen Bereich des gemeinsamen Konstruierens von Wissen gehören 
ebenso die Kategorien „Kommentare“ (Kategorie 1, dunkelgrün) sowie „Res- 
sourcen und Links teilen“ (Kategorie 2, orange). Dass insgesamt nur rund ein 
Viertel (26,0%) aller Originaltweets Kommentare oder Wertungen zum Vor- 
trags- und Tagungsgeschehen beinhalten, mag überraschen, gilt Twitter doch 
als Ort, an dem jede:r die eigene Meinung kundtut. Im Vergleich zur Digital Hu- 
manities-Community 2009 zeigten sich die Twitterstorians dennoch meinungs- 


freudiger: Dort entfielen nur 3% der Tweets in die Kategorie „Kommentare“. 


25 Ross et al., „Backchannel,“ 224. 
26 Ibid. 
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Kategorien der Historikertag-Tweets, ohne Retweets 
Entwicklung der Historikertag-Tweets hinsichtlich ihrer Kategorie und Gesamtzahl (ohne Retweets) 
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Quelle: Twitter-AP| und Tweet-Sammlung mithilfe von Scraping-Tools im Anschluss an die Veranstaltung, manuelle Kategorisierung, n = 6.358 


Abb. 8: Entwicklung der Auswertung der Funktionen von Tweets 


Die Anzahl der Originaltweets, die Ressourcen und Links teilen (Kategorie 2, 
orange) blieb im Laufe der Jahre in absoluten Zahlen zwar gleich. Ihr Anteil am 
Gesamtkorpus ging jedoch stark zurück, mit einem regelrechten Einbruch zwi- 
schen 2012 (22,1%) und 2014 (6,2%). In Hamburg 2016 sank der Anteil auf 5,1% 
und stieg dann in Münster 2018 auf 7,8%. Dies bestätigt die statistische Aus- 
wertung der Anzahl der Originaltweets mit Links, die sich von 38,6% in 2012 
quasi halbiert auf 16,3% in 2014 und sich dort bei den beiden folgenden Histo- 
rikertagen etwa einpendelt.”” 

Zu beobachten ist ebenso ein Rückgang der Gespräche (Kategorie 3, lila) 
unter dem Tagungshashtag von 16,5 % in Mainz 2012, mit einem Einbruch 2018 
in Münster, als der Anteil auf nur 7,0% absank. Da die über die Metadaten von 
Twitter ermittelten Replies jedoch auf 29,7 % ansteigen, bestätigt sich die These, 
dass bei Gesprächen der Tagungshashtag oftmals weggelassen wird, häufig be- 
wusst, um das Gespräch weniger offiziell zu machen.”® Dies könnte insbesonde- 
re in Münster eine Rolle gespielt haben (siehe Abschnitt 6). 


27 2016 beinhalten 13,6% der Originaltweets einen Link, 2018 sind es 16,3 %. 
28 Generell fehlen in Hashtag-Korpora zahlreiche Antworten, weil der Hashtag weggelassen 
wurde, vgl. Bruns und Stieglitz, „Metrics,“ 75. 
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Weiter ist zu beobachten, dass Twitter auch in der historischen Fachcom- 
munity zunehmend ein Ort der Eigenwerbung und Selbstdarstellung geworden 
ist.” Die Kategorie 5 „Onlinepräsenz gestalten und Werbung für eigenes Panel, 
eigene Publikation“ (helles Grün) umfasste 2012 in Mainz 15,3%, sank 2014 auf 
9,7% ab, bevor der Anteil 2016 auf ein gutes Fünftel anstieg (20,7%) und beim 
vorerst letzten Historikertag 2018 in Münster einen Höchststand von 27,3% er- 
reichte und damit die „Kommentare“ von Platz zwei im Kategorienschema ver- 
drängte. Zu beachten ist dabei, dass Kategorie 5 sehr divers ist und witzig ge- 
meinte Tweets genauso umfasst wie Hinweise zu eigenen Sektionen und Veran- 
staltungen, so dass es zu Fehlern in der Kodierung gekommen sein kann. 
Genau wie Gespräche dienen diese Tweets zugleich der Beziehungspflege und 
dem Aufbau von Netzwerken. Zum Vergleich: bei den Tagungen der Digital Hu- 
manities-Community 2009 entfielen weit weniger als halb so viele Tweets auf 
diese Kategorie (rund 10 %)*°, wobei offenbleibt, ob dieser Unterschied nur den 
allgemeinen Wandel der Praktiken oder auch communityspezifisches Verhalten 
spiegelt. 

Wenig überraschend ist, dass wissenschaftliche Einrichtungen und Unter- 
nehmen in unserem Beispielkorpus ganz überwiegend Tweets zur Selbstpromo- 
tion (Kategorie 5) posten. Bei den Unternehmen erreicht diese Kategorie einen 
Spitzenwert: Dort fallen über die Hälfte ihrer Tweets (54,6 %) in diese Kategorie. 
Umgekehrt bedeutet dies zugleich, dass knapp über 45% der Tweets nicht der 
Eigenwerbung dienen, was zeigt, dass sich die Kommunikation in den sozialen 
Medien auch bei Unternehmen deutlich von der üblichen Presse- und Öffent- 
lichkeitsarbeit unterscheidet. Die Interaktion über Likes und Retweets mit den 
Tweets von Einrichtungen und Unternehmen ist generell hoch, was zeigt, dass 
sie eng mit der twitternden Zunft verbunden sind. 


29 Twitter hat sich über die Jahre zu einem „self-promotional environment“ gewandelt, so 
Burgess und Baym, Twitter, 83. 
30 Ross et al., „Backchannel,“ 226. 
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Männlich: Kategorien der Historikertag-Tweets, nur Originaltweets 
Relative Entwicklung der Historikertag-Tweets von Männern hinsichtlich ihrer Kategorie und Gesamtzahl (ohne Retweets) 
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Quelle: Twitter-API und Tweet-Sammlung mithilfe von Scraping-Tools im Anschluss an die Veranstaltung, manuelle Kategorisierung, n = 2.573 


Abb. 9: Anteil der Funktionskategorien in den Tweets der von Männern geführten Accounts 
(von 100 %) 


Interessant ist die Verteilung der Funktionen von Tweets bei den persönlichen 
Accounts: Während bei den Historikern „Notizen machen“ (37 %), „Kommenta- 
re posten“ (31,5%) und „Onlinepräsenz gestalten“ (11,3%) die drei wichtigsten 
Funktionen für die Tagungstweets darstellen (Abbildung 9), steht bei den Histo- 
rikerinnen „Kommentare posten“ (30,4%) an erster Stelle vor „Notizen ma- 
chen“ (26,4%) auf Platz zwei und „Gespräche“ (17,7%) auf Platz drei (Abbil- 
dung 10). „Onlinepräsenz gestalten“ liegt bei den Historikerinnen nur auf Platz 
vier, auch wenn der Anteil mit 15,2% höher ist als bei den Historikern. Ob diese 
Verteilung auf ein unterschiedliches Kommunikationsverhalten bei Twitter hin- 
deutet, bleibt angesichts der Grenzen der Studie und der komplexen Zusam- 
menhänge der Kommunikation schwer zu sagen. 
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Weiblich: Kategorien der Historikertag-Tweets, nur Retweets 
Relative Entwicklung der Historikertag-Tweets von Frauen hinsichtlich ihrer Kategorie und Gesamtzahl (nur Retweets) 
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Quelle: Twitter-API und Tweet-Sammlung mithilfe von Scraping-Tools im Anschluss an die Veranstaltung, manuelle Kategorisierung, n = 1.992 


Abb. 10: Anteil der Funktionskategorien in den Tweets der von Frauen geführten Accounts (von 
100 %) 


Organisatorische Fragen nehmen 4,5 % der Originaltweets im gesamten Korpus 
ein, mit einem Höchststand von 5,5% beim Historikertag 2014 in Göttingen, 
was auch daran liegen dürfte, dass der Account @Historikertag 2014 besonders 
aktiv war und damit Gesprächsbereitschaft signalisierte. 1,1% der Original- 
tweets ließen sich keiner Kategorie zuordnen (Kategorie 7, braun). 

Insgesamt wird aus der statistischen Beschreibung und der Analyse der 
Funktionscodes eine Veränderung der Twitternutzung bei den Historikertagen 
von 2012 bis 2018 deutlich: Die noch wenigen Twitterstorians versuchen 2012 mit 
einer hohen Anzahl an Tweets pro Account eine breite Dokumentation des Histo- 
rikertags zu erreichen. 38,6 % der Tweets sind mit Links angereichert, 22,1% ent- 
halten fachliche Hinweise und einschlägige Literatur als Serviceleistung für die 
Fachcommunity. Es gibt mehr Gespräche und Diskussionen unter dem Tagungs- 
hashtag. Die Aktivitäten verlagern sich in der Folge vom Posten eigener Tweets 
hin zum Lesen, Liken und Verbreiten der Tweets von anderen. Tweets mit Menti- 
ons und Antworten nehmen zu, Unterhaltungen unter dem Tagungshashtag ge- 
hen aber zurück und angesichts der größer werdenden Community steigen diese 
Zahlen nicht analog. Durch die Zunahme an mitlesenden Kolleg:innen und offizi- 
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ellen Accounts könnte der Druck zur Selbstdarstellung zugenommen haben, was 
unter anderem ein Grund sein könnte für das Sinken der Anzahl an Originalt- 
weets und für die Zunahme an Tweets zur Selbstdarstellung. 


4 Community-Netzwerke 


Welche Cluster und Communities lassen sich innerhalb des Twitter-Netzwerks 
erkennen?’ Ein erster Blick auf die visuelle Darstellung des Graphen zeigt keine 
explizit abgetrennten Cluster und Communities. Die Größe der einzelnen Kno- 
ten basiert auf deren Fingangsgrad, hier also der Anzahl der Follower:innen in- 
nerhalb des Netzwerks. Anders als die Darstellung suggerieren mag, ist die 
Dichte des Netzwerks mit 0,044 nicht sehr groß (0 = keine Kanten, 1 = eine Kan- 
te zwischen allen untersuchten Knoten). 67% der Accounts folgen weniger als 
100 anderen Accounts aus dem Netzwerk und werden von weniger als 100 Ac- 
counts gefolgt.” 


Alle User:innen, die zu einem der 
Konferenzhashtag gepostet haben 
und denen mindestens zwei weitere © 
Accounts aus dem Netzwerk folgen 
n=1.711 


eingefärbte Communitys basierend 
auf Modularität 


Knotengröße basierend auf Anzahl der 
Follower:innen innerhalb der Community 


Qw (OEY ©250 02 


31 Für die Netzwerkanalyse gilt n = 1711, vgl. Anm. 17. 

32 Der durchschnittliche Clusterkoeffizient, das Maß für Untergruppen/Cliquen, ist mit 0,321 
relativ hoch, der durchschnittlich ktirzeste Pfad zwischen zwei Knoten betragt 2,306, der langs- 
te kurze Pfad 6. 
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Abb. 11 und 12: Netzwerk-Graph eingefärbt hinsichtlich der auf Modularität basierenden Com- 
munities, links mit Follow-Verbindungen, rechts beispielhafte Kennzeichnung einzelner Ak- 
teur:innen 


Die Modularität des Graphen offenbart eigene Sub-Communities, die sich je- 
doch nicht als eigene Cluster aus dem Gesamtgraphen herauslösen. Diese Sub- 
Communities sind zunächst durch Accounts mit hohen Followerzahlen be- 
stimmt. Eine nähere Beschreibung kann durch das weitere Filtern der Daten er- 
folgen: Im oberen rechten Teil (grün eingefärbt) sind viele Akteur:innen aus 
dem Bereich der Digital History vertreten. In deren direkter Nachbarschaft be- 
finden sich Akteur:innen aus dem Archivwesen. Dies bestätigt sich durch ein 
Filtern der Accounts hinsichtlich der Verwendung der Hashtags #digital und 
#archiv (Abbildung 13 und 14).”? Im Zentrum sowie im unteren Teil des Graphen 
zeigen sich viele Akteur:innen aus der „traditionellen“ Geschichtswissenschaft, 
ohne auf den ersten Blick besondere Netzwerke hinsichtlich bestimmter thema- 
tischer Spezialisierungen zu bilden (in blau). Viele der orange eingefärbten 
Akteur:innen unterscheiden sich von der blau eingefärbten Sub-Community 


33 Innerhalb dieses Netzwerks haben alle Gruppen einen Bezug zu Archiven, was sich im Pos- 
ten von Tweets mit dem Wort „Archiv“ widerspiegelt. Als Hashtag verwendet zeigt sich aber ein 
starker Bezug zu Accounts aus dem Archivwesen. Diese Argumentation lässt sich analog auf 
die Digital-History-Akteur:innen und die Verwendung des Hashtags „digital“ übertragen. 
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Accounts, die das Accounts, die das 
Hashtag #digital Hashtag #archiv 
benutzt haben (83) benutzt haben (66) 


Accounts, die das Wort Accounts, die das Wort 
„kolonial“ oder „colonial“ „Sektion“ getweetet haben 
getweetet haben (29) (309) 


Abb. 13-16: Darstellung des gefilterten Netzwerks nach Verwendung verschiedener Hashtags 
und Schlüsselworte 
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dadurch, dass sie bereits bei den Historikertagen 2012 und 2014 aktiv waren, 
wie die Analyse der Netzwerkdarstellung für die einzelnen Veranstaltungen 
zeigt. Sie bilden zusammen mit Akteur:innen aus der Digital History die early 
adopters beim Konferenztwittern anlässlich der Historikertage. Im linken Teil 
des Graphen sind Accounts aus dem Bereich Presse und Medien vertreten, dies 
lässt allgemein auf eine interessierte Öffentlichkeit schließen (in lila einge- 
färbt). Dieser Eindruck bestätigt sich durch ein Filtern des Graphen nach Ac- 
counts, die Wörter benutzen, die direkt auf das Vor-Ort-Tagungsgeschehen be- 
zogen sind: Das Wort „sektion“ beispielsweise kommt in diesem Teil des Gra- 
phen kaum vor. Vermutlich ist aus dieser Teilgruppe nur ein geringer Teil an 
Personen während der Tagung tatsächlich vor Ort. 

Es bleibt anzumerken, dass eine reine visuelle Analyse der komplexen Twit- 
terdaten und Followernetzwerke nur begrenzt aussagekräftig ist, zumal Visuali- 
sierungen oft einen suggestiven Charakter haben.* In dieser Auswertung geben 
die Visualisierungen Hinweise auf Sub-Communities und laden zum weiteren 
explorativen Entdecken der Daten direkt in Gephi ein. 


5 Perspektiven auf Inhalte der Tweets 


Das für die Analyse mit Voyant-Tools vorbereitete Tweetkorpus enthält nach 
der Datenbereinigung 77 356 Wörter. Die Wortschatzdichte beträgt 0.217. Dem- 
nach kommt jedes fünfte Wort nur einmal vor. Im Vergleich verfügt das Teilkor- 
pus der Tweets von Frauen (0.283) über eine etwas höhere Wortschatzdichte als 
das der Männer (0.265). Die Wortschatzdichte der Korpora von Personen ist da- 
mit insgesamt relativ hoch. Zu erwähnen ist, dass im Korpus 1108 verschiedene 
Hashtags auftauchen, davon 508 nur einmal, was für die Kreativität der Twitter- 
storians beim Verfassen ihrer Tweets spricht. 


Tab. 2: Top 15 der häufigsten Wörter (trunkiert) in den Originaltweets 


Wort Häufigkeit Relative Frequenz 
digigw14 349 4239 
digital 342 4154 
sektion 263 3194 
digigw16 220 2672 


34 Vgl. Martin Grandjean, „A Social Network Analysis of Twitter: Mapping the Digital Huma- 
nities Community,“ Cogent Arts & Humanities 3/1 (2016), doi: 10.1080/23311983.2016.1171458. 
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Tab. 2 (fortgesetzt) 


Wort Häufigkeit Relative Frequenz 
gut 186 2259 

münster 169 2052 
historyslam 159 1931 

frage 149 1810 

twitter 122 1482 

uhr 109 1324 
göttingen 106 1287 

stand 106 1287 
hamburg 105 1275 
histmat14 102 1239 
spannend 97 178 

panel 93 0,0011137992 
gauck 92 0,0011018228 
online 92 0,0011018228 
thema 89 0,0010658938 
gerade 88 0,0010539175 


Mit Blick auf die Top 20 der meist verwendeten Begriffe im Gesamtkorpus von 
2012-2018 zeigt sich, dass in den Tweets zu den Historikertagen digitale The- 
men klar im Vordergrund stehen (Tabelle 2). Am häufigsten genannt sind die 
spezifischen Sektionshashtags der AG Digitale Geschichtswissenschaft im Ver- 
band der Historiker und Historikerinnen Deutschlands (VHD), also digigw14, di- 
gigwl16 sowie der Wortstamm „digital“. Wie schon in der Netzwerkanalyse ge- 
zeigt, waren es vor allem Digital Historians, die anlässlich der Historikertage 
getwittert haben, und zwar zu digitalen Themen. Dass dieses Korpus von einer 
Tagung stammt, von der live berichtet wird, ist ebenfalls deutlich zu sehen an 
häufig enthaltenen Begriffen wie „Sektion“, „Uhr“, „Workshop“, „Panel“, „Vor- 
trag“, „Diskussion“, „gerade“. 

Die Frequenzanalyse zeigt außerdem, dass der 2014 durchgeführte History- 
slam ebenso wie die Sektion zur materiellen Kultur (#histmat) und die Clark- 
Krumeich-Debatte von 2014 über den Ausbruch des Ersten Weltkriegs (unter- 
schiedliche Hashtags, daher hier nicht in den Top 15) zu den am häufigsten bet- 
witterten Sektionen außerhalb von digitalen Themen gehören. Diese Sektionen 
wurden live gestreamt, was häufig den Effekt hatte, dass dazu mehr getwittert 
wurde (wobei bei #histmat nur fünf Accounts für 102 Tweets gesorgt haben). 
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Tab. 3 : Top 15 der häufigsten Wörter (trunkiert) in den Originaltweets der Manner 


Wort Häufigkeit Relative Frequenz_ 
digigw14 185 5093 
digital 139 3827 
sektion 106 2918 
histmat14 98 2698 
historyslam 91 2505 
gut 72 1982 
frage 70 1927 
kasino 68 1872 
gauck 56 1542 
agag 54 1487 
twitter 54 1487 
kokowi 48 1321 
münster 48 1321 
digigw16 47 1294 
diskussion 44 1211 


Tab. 4: Top 15 der häufigsten Wörter (trunkiert) in den Originaltweets der Frauen 


Wort Häufigkeit Relative Frequenz 
digigw16 124 5725 
digigw14 116 5355 
Digital 108 4986 
sektion 89 4109 
gut 59 2724 
münster 52 2401 
frage 44 2031 
spannend 43 1985 
twitter 38 1754 
hamburg 32 1477 
historyslam 32 1477 
panel 31 1431 
gerade 29 1339 
historydebate 29 1339 


online 29 1339 
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Interessant ist der Vergleich zwischen den von Männern und den von Frauen 
geposteten Originaltweets im Hinblick auf die betwitterten Sektionen. Bei den 
Frauen sind außerdem die Adjektive „gut“ und „spannend“ prominent platziert 
(Tabelle 4). In absoluten Zahlen haben Männer zwar das Wort „gut“ häufiger 
verwendet: 72 zu 59. Aber der Wert der relativen Häufigkeit in Bezug zum jewei- 
ligen Korpus ist bei den Frauen signifikant höher. Insgesamt überwiegen ganz 
deutlich positive Bewertungen von Vorträgen und Vortragenden unter den Ta- 
gungshashtags.” Allerdings führt eine Betrachtung der Tweets und Antworten 
auf weitere Tweets ohne Tagungshashtag, in denen deutlicher Kritik geäußert 
wurde. Die Erkenntnisgrenzen der rein digitalen Inhaltsanalyse von Tweets mit 
Voyant-Tools sind nicht zu übersehen. Sie erschöpfen sich zumeist in Einzelbe- 
obachtungen, wie etwa, dass im Korpus der Frauen das Wort „spannend“ im 
Laufe der Zeit das Wort „gut“ als Bewertung abzulösen scheint. Die verschiede- 
nen Visualisierungen laden jedoch zu einer explorativen Textanalyse im Wech- 
sel mit einem Close Reading ein und zeigen weitere Fragen und Themen auf, für 
die eine vertiefte Analyse lohnend erscheinen. 


Sonderfall 2018? 
Tab. 5: Top 15 der häufigsten Wörter an Originaltweets im Teilkorpus 2018 


Wort Häufigkeit Relative Frequenz- 
münster 161 6955 
digital 106 4579 
sektion 60 2592 
gut 39 1685 
panel 37 1598 
spannend 37 1598 
histocamptag 35 1512 
uhr 35 1512 
poster 31 1339 
doktorandenforum 30 1296 
resolution 30 1296 
thema 29 1253 
workshop 28 1210 
archivtag 27 1166 
gespaltene 27 1166 


35 Von den insgesamt 186 verwendeten Tweets mit dem Wort „gut“ gibt es nur in neun Fällen 
die Kombination „nicht gut“. 


342 —— Mareike König und Paul Ramisch 


Fiir das Teilkorpus des Historikertags von 2018 wird deutlich, dass digitale The- 
men zwar weiterhin am haufigsten in den Tweets behandelt werden (Tabelle 5). 
Doch fehlt die Sektion der AG Digitale Geschichte, und auch nicht-digitale Sek- 
tionen tauchen bei Twitter auf, wie etwa das iiberwiegend von jungen und auf 
Twitter aktiven Historiker:innen besuchte „Schnupperhistocamp“ (hashtag 
„histocamptag“). Das „Doktorandenforum“ ist laut Frequenzanalyse gleich häu- 
fig erwähnt wie die „Resolution“ des Verbandes, über die auch mit dem hashtag 
#vhdresolution (17 mal) getwittert wurde, das heißt in absoluten Zahlen spielte 
die Resolution mit 47 Originaltweets während des Historikertags bei Twitter kei- 
ne hervorgehobene Rolle. Das zeigt ebenso der chronologische Verlauf der rela- 
tiven Frequenzen, der Auftreten und Zunahme des Worts „Resolution“ auf Twit- 
ter ab Donnerstag nach der Mitgliederversammlung verdeutlicht (Abbildung 17). 
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Abb. 17: Relative Frequenzen ausgesuchter Worte im Korpus 2018 in chronologischer Abfolge 
im Vergleich 


Wie das explorative Analysieren in Voyant-Tools zeigt, stand 2018 bei Twitter 
ein anderes Thema im Vordergrund: die Postersession des Doktorandenforums 
und im weiteren Sinne der Umgang mit dem „Nachwuchs“ in der Wissenschaft. 
Die Tweets dazu unter dem Tagungshashtag waren zahlreicher, als es die Fre- 
quenzen in Abbildung 17 und Tabelle 5 nahelegen, da sie kein einheitliches Vo- 
kabular oder einheitliche Hashtags umfassten. Rund 130 Originaltweets mit 
hashtag #histag18 konnten wir dazu identifizieren (in einem Korpus von insge- 
samt 1429 Originaltweets), also knapp 10%. Zahlreiche Diskussionsstränge 
zum Doktorandenforum und zum Umgang mit dem Nachwuchs wurden ohne 
Tagungshashtag publiziert und sollten dadurch vermutlich bewusst unter dem 
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Radar bleiben. Ein Close Reading der Tweets zeigt die Emotionalität des The- 
mas: Das Doktorandenforum sorgte bei den Promovierenden fiir Unmut, weil 
die Veranstaltung in einem abseits gelegenen, nicht ausgeschilderten Raum 
stattfand, einige Poster zu Beginn nicht gedruckt vorlagen (wofiir die Veranstal- 
ter zuständig waren) und die Promovierenden sich damit auf einen Neben- 
schauplatz gestellt fühlten. Dies ereignete sich am ersten Tag und das Thema 
zog sich damit durch die Veranstaltung. 

Auffallend sind die hohen Retweet- und Like-Zahlen bei den kritischen 
Tweets, die für eine relative Dominanz des Themas sorgten. Neben der Ankün- 
digung des offenen Briefs im Portal LISA, der 2018 wie auch im gesamten Kor- 
pus der am häufigsten geteilte Tweet war, zogen die kritischen Tweets von zwei 
Professoren die häufigsten Likes und Retweets auf sich, ein Zeichen für die Un- 
terstützung für das Anliegen der Doktorand:innen durch Teile der Community 
wie auch für das hierarchische Gewicht der beiden Professorenaccounts. Von 
den Top zehn der am häufigsten gelikten Tweets 2018 waren die ersten vier mit 
thematischem Bezug zum Doktorandenforum. Zugleich fällt die Stille der Veran- 
stalter und des Verbandes bei Twitter zum Thema Doktorandenforum auf: We- 
der der Tagungsaccount @historikertag noch der VHD antworteten bei Twitter 
auf die Vorwürfe. Auch aufgrund dieses Schweigens dürften die Doktorand:in- 
nen den Kanal gewechselt und einen offenen Brief an den VHD im Portal LISA 
publiziert haben, der dort zahlreiche Kommentare erhielt.” Der Retweet der An- 
kündigung des Antwortbriefes des Verbandes war der einzige Tweet des VHD 
zum Thema.*® 

Die Kontroverse um das Doktorandenforum könnte ein Grund sein, warum 
2018 die Kommunikation auf Twitter zum Historikertag quantitativ rückläufig 
war. Zum einen - so ein Erklärungsversuch - könnten die beiden offiziellen 
Accounts mit ihrer im Vergleich zu den Vorjahren zurückhaltenden Twitterkom- 
munikation (unbeabsichtigt) den Trend vorgegeben haben. Tagungen, bei de- 


36 Der Account setzte während der Tagung ohnehin nur wenige Tweets ab, während er im 
Vorfeld der Tagung auf Twitter recht aktiv war. Insgesamt nur 47 Tweets wurden vom offizi- 
ellen Account unter dem Tagungshashtag gepostet. Zum Vergleich die Anzahl der Tweets des 
Accounts @Historikertag anlässlich der vorherigen Historikertage: 2012: 0, 2014: 196, 2016: 105. 
37 „Gespaltene Zunft? Welchen Stellenwert haben Promovierende für den Historiker_innen- 
verband?,“ Portal LISA, 27.9.2018, Zugriff am 27.7.2021, https://lisa.gerda-henkel-stiftung.de/ 
offener_brief_historikertag18. Dazu die Antwort: „Antwort auf den offenen Brief der Doktoran- 
dinnen und Doktoranden,“ Portal LISA, 28.9.2018, Zugriff am 27.7.2021, https://lisa.gerda-hen 
kel-stiftung.de/antwort_auf_offenen_brief. 

38 Der VHD postete zum Historikertag 2018 zwölf eigene Tweets und 19 Retweets (insgesamt 31 
Tweets), war aber auch bei den vorhergehenden Veranstaltungen auf Twitter eher zurückhal- 
tend (der Account existiert seit Dezember 2013), 2014: 20, 2016: 46 Tweets. 
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nen es offizielle Accounts gibt, die zum Twittern aufmuntern oder wie bei den 
Historikertagen 2014 und 2016 eine eigene Twitter Lounge haben, erhalten ge- 
nerell eine höhere Präsenz in den sozialen Medien. Zugleich drängte das 
Schweigen der offiziellen Accounts die Kontroverse in andere Kanäle - und 
zwar in die Blogosphäre - so dass die offizielle Diskussion dazu auf Twitter 
nachließ. Die sonst auf Twitter aktiven Doktorand:innen widmeten ihre Auf- 
merksamkeit anderen Inhalten und anderen Kanälen und hielten sich mit 
Tweets zum sonstigen Tagungsgeschehen zurück.” Die auf Twitter in Teilen be- 
schädigte Atmosphäre regte darüber hinaus die Community nicht zum Ta- 
gungstwittern an. Weitere Gründe dürften ebenso eine Rolle für den Tweetriick- 
gang gespielt haben: So zeigt ein Blick in die Zahlen der aktivsten Accounts, 
dass Personen, die bei einer Veranstaltung viel getwittert hatten, etwa weil sie 
vor Ort wohnen oder in die Organisation eingebunden waren, bei den Histori- 
kertagen danach sehr viel passiver waren. Auch andere Studien zeigen, dass 
die Twitternutzung ein und derselben Person bei einer Veranstaltung von Jahr 
zu Jahr unterschiedlich sein kann.*° Es bleibt also abzuwarten, wie sich die 
Praktiken und Nutzungsformen bei den nächsten Historikertagen weiterentwi- 
ckeln. 
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Oliver Kiechle 

Noisy digitalia - Kommunikationslarm in 
Born Digital-Quellen am Beispiel von Spam 
im Usenet 


Abstract: Historical work that is based on source material from the field of digi- 
talia, thus meaning Born-digital sources, often meets a phenomenon, that is so 
far unknown to historians in such an extent: Communication noise. It can be 
found as unwanted advertisement, off-topic comments and even blunt offences. 
Taking the example of Spam messages in the Usenet of the 1980s and 1990s the 
article will show how communication nuisance developed during early internet 
communication and what is its part in historical tradition. With Flaming and 
Social bots two other manifestations of Noisy digitalia will be considered. Based 
on that it will be discussed, how historical work can deal with noise in digitalia 
both in a conceptional and a technical way as well. 


Keywords: digitalia, communication noise, social media, Usenet, spam, web 
history 


Zusammenfassung: Bei der geschichtswissenschaftlichen Arbeit mit Quellen- 
bestanden aus dem Bereich der digitalia, also genuin digital entstandenem Ma- 
terial, macht sich vor allem im Bereich der Social Media-Quellen ein fiir die 
historische Zunft in diesem Ausmaß ungewohntes Phänomen bemerkbar: Kom- 
munikationslärm. Dieser Noise kann in Form von unerwünschter Werbung, un- 
passenden Kommentaren bis hin zu offenen Beleidigungen auftreten und vor 
allem die automatisierte Analyse größerer Datenbestände beeinflussen. 

Im Artikel wird am Beispiel von Spam-Nachrichten im Usenet der 1980er 
und 1990er Jahre beschrieben, wie sich Lärm in der frühen Internet-Kommuni- 
kation entwickelt hat und welchen Anteil er in der Überlieferung einnimmt. Er- 
ganzend werden mit Flaming und Social Bots zwei weitere Spielarten der Noisy 
digitalia beschrieben. Davon ausgehend wird erörtert, wie mit diesen Störgeräu- 
schen im Rahmen einer historischen Beschäftigung mit digitalia sowohl konzep- 
tionell als auch technisch umgegangen werden kann. 


Schlagwörter: Digitalia, Communication Noise, Social Media, Usenet, Spam, 
Web history 


3 Open Access. © 2022 Oliver Kiechle, published by De Gruyter. [OM Dieses Werk ist lizensiert unter 
einer Creative Commons Namensnennung 4.0 International Lizenz. 
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Der digitale Austausch ist oft mit inhaltlich unpassenden Einstreuungen oder 
von externen Akteur:innen platziertem Content durchsetzt, der bestenfalls läs- 
tig, schlimmstenfalls sogar destruktiv sein kann. Dieser Kommunikationslärm 
ist zu einem selbstverständlichen Teil der digitalen Welt avanciert und nimmt 
dort einen unübersehbaren Stellenwert ein. So kann beispielswiese mehr als die 
Hälfte der verschickten E-Mails im Jahr 2019 als Spam-Nachrichten klassifiziert 
werden.! Diese Störgeräusche - seien es Werbeanzeigen auf Webseiten, invek- 
tive Kommentare in Foren und Chats oder eben die allgegenwärtigen Spam- 
Nachrichten in Mails oder Newsgroups - beeinflussen nicht nur unsere alltägli- 
che Kommunikation, sondern machen sich ebenfalls bei der historischen Ana- 
lyse entsprechender archivierter Quellen bemerkbar. Im Folgenden soll deshalb 
zunächst eine Einordnung von genuin digitalen Materialien im Hinblick auf ih- 
ren historischen Kontext gegeben werden. Davon ausgehend werden anhand 
des Beispiels von Spam-Nachrichten im Usenet der 1990er Jahre verschiedene 
Aspekte des Auftretens von Noisy digitalia erörtert. Danach soll der Blick kurz 
auf weitere Störfeuer in digitalem Quellenmaterial gerichtet und abschließend 
Auswirkungen auf die historische Analyse thematisiert werden. 


1 Digitalia 


In der deutschsprachigen Geschichtswissenschaft wird das hier behandelte Ma- 
terial etwas sperrig gerne als genuin digital entstandene Quellen bezeichnet.? 
Ein wenig griffiger hören wir auf Englisch hingegen von den Born Digital 
Sources, so beispielsweise bei Niels Briigger,? der neben Digitized (also digitali- 
sierten analogen Objekten) und Born-Digital mit Reborn noch eine dritte Katego- 
rie digitalen Materials beschreibt: „Reborn digital material is born-digital mate- 
rial that has been collected and preserved, and that has been changed in this 
process to such an extent that it is not identical to the born-digital material 


1 Vgl. Statista, „Spam-Mails - Anteil am gesamten E-Mail-Verkehr weltweit bis 2019,“ Zugriff 
am 19.08.2021, https://de.statista.com/statistik/daten/studie/872986/umfrage/anteil-der-spam- 
mails-am-gesamten-e-mail-verkehr-weltweit. 

2 So zum Beispiel Catherina Schreiber, „Genuine Internetdaten als historische Quellen — Ent- 
wurf einer korrealistischen Quellentheorie,“ Zeitschrift für digitale Geschichtswissenschaften 0/1 
(2012), http://hdl.handle.net/10993/7981. 

3 Vgl. Niels Brügger, The Archived Web: Doing History in the Digital Age (Cambridge, Massa- 
chusetts/London: The MIT Press, 2018) 
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from which it was made.“* Die Veränderung von digitalen Daten durch Archi- 
vierung beziehungsweise Wiederherstellung wird uns im Zusammenhang mit 
der Überlieferungsgeschichte des Usenet zu einem späteren Zeitpunkt noch ein- 
mal begegnen. In Hinsicht auf eine allgemein praktikable Begrifflichkeit möchte 
ich jedoch für eine noch stärkere Vereinfachung plädieren und deshalb für Ob- 
jekte, die auf der rein digitalen Ebene entstanden, gespeichert und transportiert 
worden sind, den Terminus der digitalia etablieren. Dazu zählen unter anderem 
E-Mails, Webseiten, digitale Textdokumente, Social Media-Inhalte, digitale Bil- 
der und Videos, aber eben auch solche Datenbündel wie Logfiles, Programm- 
code, Bewegungsdaten oder Computerspiele. All diese digitalia können bereits 
für heutige und perspektivisch noch stärker für künftige Historiker:innen von 
entscheidender Bedeutung sein. Zeitgeschichtliche Forschung ist - zumindest 
für Themenbereiche, die ab den späten 1980er Jahren angesiedelt sind - ohne 
die Berücksichtigung dieser Quellen kaum mehr vorstellbar. Für aktuellere Zeit- 
räume stellen sie bereits jetzt manchmal nur das einzig verfügbare Quellenma- 
terial dar.’ 

Die in Binärcode gespeicherten digitalen Daten repräsentieren nicht direkt 
die eigentlichen Inhalte, sondern letztlich nur die Codierung dieser Inhalte in 
maschinenlesbaren Befehlen, die den Computer beispielsweise dahingehend 
steuern, die hinterlegten Werte als Pixel auf dem Schirm zu zeigen, sie als Buch- 
staben auf Papier zu drucken oder sie anhand eines programmierten Algorith- 
mus zu verändern. Das bedeutet, dass jeglicher Zugang zu den Daten und ihrer 
Bedeutung eine maschinelle Decodierung benötigt: „[D]er Umgang mit Informa- 
tion [wird][...] nur durch die Vermittlung von Maschinen rezipierbar.“ Sowohl 
die Darstellung als auch die Analyse dieses Materials muss also durch eine 
Übersetzungsleistung des Computers stattfinden. Wir können hierbei in Anleh- 
nung an den etablierten Begriff der Computer Mediated Communication fast 
schon von einer Computer Mediated History sprechen. 

Oftmals wissen oder verstehen wir dabei nicht genau, wie die Daten durch 
die angewandten Prozesse verändert oder gefiltert wurden oder noch werden. 
Umso wichtiger ist es, zum einen die technischen Kontexte der Entstehung, Co- 
dierung, Archivierung und Überlieferung dieser Daten zu berücksichtigen und 
zum anderen die Zusammenhänge bei ihrer Darstellung und Analyse im Sinne 


4 Ibidem, 22. 

5 Dazu ausführlich Ian Milligan, History in the Age of Abundance? How the Web Is Trans- 
forming Historical Research (Montreal: McGill Queen’s University Press, 2019). 

6 Peter Haber, Digital Past - Geschichtswissenschaft im Digitalen Zeitalter (München: Olden- 
bourg Verlag, 2011), 102. 
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einer Toolkritik im Blick zu behalten.’ Diese teilweise komplexen Prozesse der 
Überlieferung digitaler Daten führen unter anderem zu der paradoxen Situati- 
on, dass zwar einerseits ein Überfluss an Informationen vorhanden zu sein 
scheint, andererseits jedoch größere Bestände aufgrund des Verlustes von pas- 
sender Software und Hardware nicht mehr benutzbar sind.® 

Dabei ergibt sich vor allem bei der Beschäftigung mit großen Datenbestän- 
den aus dem Bereich der digitalen Kommunikation - beispielsweise E-Mail, So- 
cial Media oder Chatforen - ein für die historische Zunft in diesem Ausmaß un- 
gewohntes Phänomen, das wohl am besten mit dem Begriff Noise bezeichnet 
werden kann. Dieser Kommunikationslärm tritt beispielsweise in Form von un- 
erwünschten Werbenachrichten auf, kann aber auch aus Off-Topic-Diskussio- 
nen bestehen oder gar aus gezielten Verbalattacken in Form von so genanntem 
Flaming oder Trolling. Diese Störgeräusche können in unterschiedlicher media- 
ler Art aufscheinen. Im Folgenden werde ich mich jedoch auf die textuellen Er- 
scheinungsformen konzentrieren. 

Bei einer direkten Beschäftigung mit dem Material im Sinne eines Close 
Reading werden solche Störungen zwar meist relativ problemlos erkannt und 
können entsprechend kontextualisiert und gegebenenfalls ausgefiltert werden. 
Gehen wir jedoch ins Distant Reading über, lassen also größere Textmengen 
computergestützt analysieren, kommt es zu einer deutlichen Beeinflussung der 
Ergebnisse durch den Kommunikationslärm, sei es bei einer simplen Wortzäh- 
lung, einer Sentimentanalyse oder beim Topic Modeling.? Das ist nicht per se 
negativ. Für manche Fragestellung kann gerade der Lärm nützlich sein und auf 
Entscheidendes hinweisen, meist verfälscht er jedoch die erhoffte inhaltliche 
Erfassung des Materials. Entsprechend muss dieser Effekt, wenn er nicht durch 
vorgeschaltetes Data Cleaning minimiert werden soll (und kann), zumindest 
einkalkuliert werden. 


7 Vgl. Andreas Fickers, „Update für die Hermeneutik. Geschichtswissenschaft auf dem Weg 
zur digitalen Forensik?,“ Zeithistorische Forschungen/Studies in Contemporary History 17/1 
(2020): 157-168, doi: 10.14765/ZZF.DOK-1765. 

8 Vgl. den Beitrag von Moritz Feichtinger in diesem Band. 

9 Zum grundsätzlichen Erkenntniswert von Topic Modeling in der historischen Quellenanalyse 
vgl. Martin Fechner und Andreas Weiß, „Einsatz von Topic Modeling in den Geschichtswissen- 
schaften: Wissensbestände des 19. Jahrhunderts,“ Zeitschrift für digitale Geisteswissenschaften 
2/2 (2017), doi: 10.17175/2017_005. Siehe auch den Beitrag von Melanie Althage in diesem Band. 
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2 Spam im Usenet 


Um sowohl die (forschungs-)konzeptionelle als auch die praktische Problematik 
besser zu veranschaulichen, sollen nun verschiedene Aspekte der Arbeit mit 
Usenet-Nachrichten der 1990er Jahre aufgegriffen werden, die ab einem gewis- 
sen Zeitpunkt immer stärker von Spam betroffen waren. 

Es handelt sich beim Usenet um ein Netzwerk von Newsservern, durch das 
eine textbasierte Kommunikation der Nutzer:innen ermöglicht wird. Nachrich- 
ten werden im Usenet in eine hierarchische Struktur unterschiedlicher News- 
groups eingestellt und dezentral gespeichert. Im Usenet entwickelten sich 
grundlegende Erscheinungsformen der Online-Kommunikation wie die Neti- 
quette oder auch die Zusammenstellung von Frequently Asked Questions (FAQ) 
zur Regelung des Informationsaustausches, aber auch negative Aspekte wie 
Flaming oder der Versand von Spam lassen sich dort früh identifizieren. Entwi- 
ckelt wurde das grundlegende Konzept im Herbst 1979. Im Sommer 1980 war 
das Projekt ausgereift genug, um auf einer Entwicklerkonferenz in Delaware 
vorgestellt zu werden. Das UNIX User Network etablierte sich schnell als eine 
Art „ARPANET für arme Leute“!°. Es war zu Beginn ganz bewusst nach koopera- 
tiven Grundprinzipien organisiert, bald gab es jedoch zunehmende Auseinan- 
dersetzungen über Meinungsfreiheit und Zensurversuche im Usenet, die 1986 
zur Neuorganisation und 1988 letztlich zur Abspaltung der (inhaltlich unabhän- 
gigen) Alternative-Hierarchie führten.” 

Spam-Nachrichten sind uns aus unseren Mailpostfachern wohlbekannt. Die 
massenhaft und normalerweise ungerichtet versendeten Nachrichten oder E- 
Mails haben oft einen kommerziellen Hintergrund, lassen sich also meist als un- 
erwünschte Werbung klassifizieren. Solche Phänomene treten bereits in der 
Computerkommunikation der 1970er Jahre erstmals auf, und auch wenn die Be- 
zeichnung Spam noch nicht benutzt wird, ist die Motivation von „Spammern“ 
in dieser Zeit nicht vorwiegend auf kommerzielle Ziele ausgerichtet: „[W]hate- 
ver you were posting, be it duplicated, way too long, saturated with quotes, 


10 Das ARPANET war die erste systematische Vernetzung von Computern in den USA, die 
jedoch nur eine enge Auswahl von Computern aus Regierungsinstitutionen und Eliteuniversi- 
täten einschloss. Eine faktisch solide Darstellung der Frühgeschichte des Usenet bieten Micha- 
el Hauben und Ronda Hauben, Netizens: On the History and Impact of Usenet and the Internet 
(Los Alamitos, California: IEEE Computer Society Press, 1997). In ihren Bewertungen bleiben 
die Haubens jedoch oftmals auffällig unkritisch, was eventuell an ihrer persönlichen Nähe zur 
Usenet Community gelegen haben könnte. 

11 Vgl. dazu ausführlicher Oliver Kiechle, „Ein Gespaltenes Netz? - Das Usenet der 1980er- 
Jahre zwischen Regulierung und Anarchie,“ in Zur Geschichte des digitalen Zeitalters, hg. v. 
Ricky Wichum und Daniela Zetti (Wiesbaden: VS Verlag für Sozialwissenschften 2022), 125-142. 
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contextually inappropriate, had broken the implicature of network conversation 
that held that you should be in some way relevant.“ Spam dient also zu Beginn 
vor allem dazu, die Méglichkeiten technischer Computernetze auszunutzen, um 
Aufmerksamkeit zu erregen: „Spammers take the infrastructure of the ‚good 
things‘ and push them to extremes.“¥ 

Diese Motivationslage änderte sich mit der Zeit zunehmend in eine kom- 
merzielle Richtung, was unter anderem durch Vorkommnisse im Usenet voran- 
getrieben wurde. Auch dort, wo man sich zwar grundsätzlich anti-kommerziell 
gab, können wir schon früh eine Vorstufe des Spammings im Extensive Cross- 
Posting feststellen. Hier zirkulierten beispielsweise ab und an Angebote von 
Computerfirmen durch das verpönte gleichzeitige Posten in mehreren News- 
groups. Für Aufsehen und Diskussionen sorgte dann jedoch vor allem ein Auf- 
ruf des Nutzers JJ im Jahr 1988, der an Dutzende Newsgroups die Aufforderung 
richtete, ihn als ziemlich abgebrannten Studenten doch finanziell zu unterstüt- 
zen.'* Wurde der JJ-Vorfall innerhalb des Usenet 1988 zwar kurz und heftig in 
Hinblick auf die inhaltliche Stabilität des Netzwerks und vor allem auf mögliche 
Sanktionen gegen JJ diskutiert, kehrte schon kurz danach wieder relative Ruhe 
ein: „Usenet returned to trading anecdotes, sharing knowledge, joking, and bi- 
ckering, the moment of self-reflexive panic slipped into memory.“ 

Die Bezeichnung Spam wurde in Anlehnung an einen alten Monty Python- 
Sketch dann Anfang der 1990er ebenfalls im Usenet geprägt. Einhergehend mit 
dem Eternal September des Jahres 1994,'° als der Internet-Anbieter AOL seinen 
Kund:innen neben dem einfachen Zugang zum gerade aufstrebenden World 
Wide Web auch Eingang zum Usenet verschaffte, nahm nicht nur die Zahl der 


12 Finn Brunton, Spam: A Shadow History of the Internet (Cambridge, Massachusetts: The MIT 
Press, 2013), 48. 

13 Ibidem, 11. 

14 Brad Templeton, „Origin of the Term ‚Spam‘ to Mean Net Abuse“ (0.D.), in Brad Temple- 
ton’s Home Page, Essays on Junk E-mail (Spam). Zugriff am 22.08. 2021, https://www.temple 
tons.com/brad/spamterm.html. 

15 Brunton, Spam, 48. 

16 Dieser begann gar nicht im Herbst, sondern bereits im März 1994. Die Bezeichnung rührte 
daher, dass es im September durch den Beginn des amerikanischen Studienjahres und entspre- 
chend vieler neuer Studierender alljährlich auch eine im Vergleich zum Rest des Jahres höhere 
Zahl an neuen Usenet-Nutzer:innen gegeben hatte. Nun stieg die Zahl durch das AOL-Angebot 
aber permanent und deutlich und vor allem über die ursprünglichen universitären (und meist 
eher liberal eingestellten) Kreise hinaus an, was viele „alte“ Nutzer:innen zunächst irritierte 
und später sogar verprellte (vgl. Bryan Pfaffenberger, „‚A Standing Wave in the Web of Our 
Communication‘: Usenet and the Socio-Technical Construction of Cyberspace Values,“ in From 
Usenet to CoWebs: Interacting with Social Information Spaces, hg. v. Christopher Lueg und 
Danyel Fisher (London: Springer, 2003), 40-41). 
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Usenet-Nutzer:innen rapide zu, sondern die unerwiinschte Kommunikation ge- 
riet ab Mitte der 1990er Jahre zu einer Massenerscheinung: Große aufsehenerre- 
gende Aktionen gab es 1994 zunächst mit der Nachricht „Global Alert for All: 
Jesus is Coming Soon“, die von einem Studenten an über 200 Newsgroups ver- 
sendet wurde, und schließlich vor allem durch die Werbung der Anwaltskanzlei 
Canter und Siegel, die ihr Angebot für Unterstützung bei der Green Card Lotterie 
automatisiert an fast alle damaligen Newsgroups verschickte.” In der Folge 
wuchs das Spam-Aufkommen im Usenet immens, so dass manche Newsgroups 
zu Beginn der 2000er Jahre regelrecht geflutet wurden und die eigentlichen Dis- 
kussionsthemen komplett untergingen. 

Anders als beim JJ-Vorfall reagierte die Community auf Canter/Siegel umge- 
hend, vor allem der automatisierte Versand der Spam-Nachricht hatte viele Sys- 
temadministrator:innen aufgeschreckt. Eine erste direkte Reaktion war eine 
Flut von E-Mails an den Internetanbieter der Kanzlei, der die Anwälte daraufhin 
prompt vom Netz nahm (eine eher symbolische Aktion, da diese einen Tag spä- 
ter wieder online waren).'® Weitreichender war jedoch die Reaktion eines bis 
heute nicht genauer identifizierten Users namens Cancelmoose, der einen Can- 
celbot entwickelte. Dieses Programm nutzte im Prinzip den gleichen techni- 
schen Ansatz wie die ursprüngliche Spam-Nachricht, wanderte automatisiert 
durch die Usenet-Newsgroups und löschte die Green Card-Nachricht, wo immer 
sie zu finden war. Auch wenn diese Vorgehensweise bei den meisten Nutzer:in- 
nen Beifall fand, flammten nun erneute Diskussionen über Zensur und Mei- 
nungsfreiheit im Usenet auf, zumal Canter und Siegel im Nachgang versuchten, 
sich als „icons of free speech on Usenet and the Internet generally“ zu gerie- 
ren.!? Um eine Nachricht als Spam klassifizieren und dann gegebenenfalls lö- 
schen lassen zu können, akzeptierte die Usenet Community schließlich den 
nach seinem Erfinder benannten Breidbart-Index als maßgebliche Kennzahl für 
exzessives Cross-Posting.?? 


3 Überlieferung von Spam im Usenet 


Das Usenet definierte sich von Beginn an als flüchtiges Medium, da vor allem 
aufgrund der damaligen Limitierungen bei Übertragungsbandbreite und Spei- 


17 Brunton, Spam, 48. 
18 Pfaffenberger, „Usenet and the Socio-Technical Construction of Cyberspace Values,“ 36. 
19 Brunton, Spam, 57. 
20 Pfaffenberger, „Usenet and the Socio-Technical Construction of Cyberspace Values,“ 39. 
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cherplatzkosten eine langere Speicherung der Nachrichten nicht vorgesehen 
und kaum möglich war. Entsprechend gibt es erhebliche Lücken in der histori- 
schen Überlieferung des Materials, insbesondere bis in die Mitte der 1990er Jah- 
re. Mehrere kleinere Sammlungen und ein größerer Korpus (die so genannten 
UTZOO-Tapes) alter Usenet-Nachrichten stellen die zentrale Überlieferung von 
Usenet-Inhalten aus den 1980er und frühen 1990er Jahren dar. Diese wurden im 
Jahr 2001 zusammen mit den von Google aufgekauften Beständen der Firma 
Deja News, die ab Mitte der 1990er Jahre versucht hatte, das Usenet systema- 
tisch zu archivieren und ihren Nutzer:innen zur Verfügung zu stellen, in die 
neu geschaffenen Google Groups integriert.” Theoretisch lassen sich über Goog- 
le Groups nach wie vor eine enorme Anzahl von historischen Usenet-Nachrich- 
ten finden, jedoch wurden in den letzten Jahren nicht nur die Suchmöglichkei- 
ten stark eingegrenzt, sondern auch automatisierte Crawl-Prozesse zur individu- 
ellen Zusammenstellung eines Korpus weitestgehend geblockt. Anhand der 
Historical Usenet Collection des Internet Archive zeigt sich jedoch, dass diese 
Blockade offenbar umgangen werden kann.” 

Analog zur gängigen Archivpraxis bedeutet Webarchivierung, dass Quellen 
selektiert, gesammelt und geordnet werden müssen. Bei digitalia finden meist 
zusätzlich technische Transformationsprozesse statt: Für die Archivierung müs- 
sen Daten eventuell bereinigt und gefiltert oder aber auch mit zusätzlichen Me- 
tadaten versehen werden, bevor sie in ein Archivformat wie zum Beispiel Web- 
ARCHive (WARC) für Internetinhalte überführt werden. Eine bei Usenet-Inhal- 
ten zusätzliche Problematik stellt der seit der Veröffentlichung von archivierten 
Usenet-Nachrichten durch Deja News und einer darauf folgenden massiven Ge- 
genwehr eines Teils der Community aufgrund von Datenschutzbedenken einge- 
führten X-No-Archive-Header dar. Diese Einstellung im Header der Nachricht 
verhindert im Normalfall eine Archivierung durch automatisierte Prozesse. Zu- 
sätzlich besteht auch nach wie vor die Möglichkeit, eigene Postings auf Antrag 
aus der Archivierung entfernen zu lassen. 

Für Spam-Nachrichten aus dem Usenet bedeutet das vor allem, dass diese 
zum Teil in die archivierten Usenet-Bestände übernommen wurden, zum Teil 
aber eben auch nicht: Entweder wurden sie bereits vor dem Archivieren syste- 
matisch gelöscht (durch Cancelbots) beziehungsweise durch die jeweiligen Nut- 
zer:innen lokal ausgefiltert oder dann während des Archivierungsprozesses ent- 


21 Camille Paloque-Bergés, „Usenet as a Web Archive: Multi-Layered Archives of Computer- 
Mediated-Communication,“ in Web 25: Histories from the First 25 Years of the World Wide Web, 
hg. v. Niels Brügger (New York et al., Peter Lang Publishing, 2017), HAL:halshs-01843627, 236. 
22 Zur Usenet-Archivierung vgl. Kiechle, „Das Usenet der 1980er-Jahre zwischen Regulierung 
und Anarchie“, 127-130. 
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fernt. Nichtsdestotrotz finden sich in einigen archivierten Newsgroups nach wie 
vor eine große Anzahl an Spam-Nachrichten, was unter anderem daraus resul- 
tiert, dass Spam in Google Groups grundsätzlich nicht pauschal ausgefiltert 
wird. 

Ein weiteres Problem von öffentlich zugänglich gemachten Usenet-Nach- 
richten besteht darin, dass Nutzer:innen im Vertrauen auf die angenommene 
Flüchtigkeit der Kommunikation dort oftmals ihre E-Mail-Adressen angegeben 
haben. Diese können nun automatisiert eingesammelt und zum Versand weite- 
rer Spam-Nachrichten benutzt werden. Diesem Umstand trägt beispielsweise 
das erst seit 2021 existierende Portal usenetarchives.com dadurch Rechnung, 
dass persönliche Informationen auf den zur Verfügung gestellten historischen 
Usenet-Nachrichten weitgehend unkenntlich gemacht wurden.” 


4 Flaming und Bots 


Neben Spam lassen sich noch weitere Arten von Lärm in digitalia finden, die an 
dieser Stelle kurz beschrieben werden sollen: Das Flaming beziehungsweise 
Trolling und so genannte Social Bots. 

Das Phänomen des Flaming, also abwertende oder gar beleidigende Einlas- 
sungen, lässt sich schon bei den ersten Gehversuchen der Online-Kommunika- 
tion in den 1970er Jahren erkennen, massiv tritt es dann mit der Etablierung 
und dem raschen Anwachsen des Usenet auf. Beim Flaming handelt es sich um 
das bewusste Versenden von provozierenden oder beleidigenden Nachrichten, 
beispielsweise in Online-Foren, Bulletin Boards oder Newsgroups. Die wortnahe 
Übersetzung von Flaming mit „zündeln“ passt zu diesem Vorgang ganz gut. Es 
geht meist darum, sachliche Diskussionen zu stören oder gar zu sprengen. Nicht 
selten entzündet sich an gleichgelagerten Reaktionen auf einen Flame ein regel- 
rechter Flame War, der die ursprüngliche Intention einer Online-Unterhaltung 
komplett in den Hintergrund rückt.” 


23 Usenet Archives, https://www.usenetarchives.com/, online seit Mai 2021. Hier lassen sich 
archivierte Usenet-Nachrichten relativ komfortabel nach inhaltlichen Aspekten durchsuchen. 
Jedoch ist zum einen nicht ganz klar, welche historischen Usenet-Bestände dort überhaupt 
eingebunden sind und zum anderen erschwert das Fehlen persönlicher Informationen - so 
nachvollziehbar diese Herangehensweise in Bezug auf Datenschutzaspekte auch ist — teilweise 
eine tiefer gehende Analyse. 

24 Michael Nycyk, „Trolls and Trolling History From Subculture to Mainstream Practices,“ in 
The SAGE Handbook of Web History, hg. v. Niels Brügger und Ian Milligan (Los Angeles et 
al.: SAGE, 2019), 580. 
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Im Usenet wurde früh versucht, dieses Verhalten einzudämmen oder zu- 
mindest zu kanalisieren. So wurde bereits in den ersten Versionen der als Neti- 
quette bekannt gewordenen Verhaltensregeln für das Posten im Usenet das Fla- 
ming mehr oder weniger geächtet.” Da es aber zum einen kaum Sanktionsmög- 
lichkeiten gegen diejenigen gab, die Flames posteten und zum anderen viele 
Nutzer:innen Gefallen an gelungenen Beleidigungen fanden, führte dieser 
Schritt meist ins Leere. Bei manchen Usern, die nur gelegentlich und oft eher 
sarkastisch gemeint ausfällig werden wollten, bürgerte es sich ein, den Flame 
mit den Tags Flame On/Flame Off zu kennzeichnen und dadurch als unsachli- 
chen Einwurf sichtbar zu machen.” Eine Möglichkeit, Flames zu kanalisieren, 
war die Einrichtung der Newsgroup net.flames, auf die aus dem Ruder laufende 
Diskussionen abgeleitet werden sollten, was jedoch nur zum Teil gelang. 

Im Usenet der frühen 1980er war es üblich, seinen echten Namen zu benut- 
zen und meist sogar noch die postalische Adresse anzugeben, was justiziable 
Beschimpfungen eher selten machte. Die zunehmende Anonymisierung und vor 
allem eine immens steigende Nutzer:innenzahl führte zu immer schlimmeren 
Flames. Ab den 1990ern findet sich das Phänomen dann in Form des Trollings 
auf beinahe allen Kommunikationsebenen des World Wide Web wieder.” In 
den heutigen Social Media sind solche Ausfälle weit verbreitet und häufig mit 
Begriffen wie Hate-Speech, Shitstorm oder Fake News verknüpft. 

Ab den 2000er Jahren machen sich zudem vermehrt Social Bots in der On- 
line-Kommunikation bemerkbar, obwohl auch diese beileibe keine neue Er- 
scheinung waren. Bei Bots handelt es sich um algorithmisch gesteuerte und oft 
mit Hilfe von Machine-Learning programmierte Tools, die versuchen, die 
menschliche Kommunikation im Internet im Sinne ihrer Programmierer:innen 


25 Vgl. eine der ersten und vermutlich am meisten rezipierte Kodifizierung der Usenet-Neti- 
quette: Chuq v. Rospach, „A Primer on How to Work with the USENET Community,“ Zugriff am 
05.07.2019, http://www.mit.edu/afs.new/athena/activity/i/isig/Primer/usenet-primer. 

26 Denis Howe, „Flame from FOLDOC,“ Free Online Dictionary of Computing, Zugriff am 
30.08.2021, https://foldoc.org/flame. 

27 Die Bezeichnung „Troll“ wurde offenbar ebenfalls im Usenet geprägt, vgl. Nycyk, „Trolls 
and Trolling History,“ 580. 
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zu simulieren und zu beeinflussen.” Wir finden diese Programme schon im 
Usenet der 1990er Jahre beispielsweise in Form der vorher erwähnten Cancel- 
bots. Dabei handelt es sich aber meist um Einzelaktionen. Mit Auftreten der gro- 
ßen Social Media Plattformen in den 2000er Jahren halten Social Bots relativ 
schnell massenhaften Einzug in die Online-Kommunikation. Diese agieren 
meist zweckgerichtet: Es geht zum Beispiel darum, bestimmte Kanäle mit auf 
den ersten Blick regulären Messages zu blockieren, personalisierte Werbung für 
bestimmte Produkte zu platzieren, Trends zu kreieren oder schlicht um Trolling. 
In diesen Zusammenhang sind aktuelle Diskussionen um eine mögliche Beein- 
flussung politischer Wahlen durch Bots in sozialen Netzwerken einzuordnen. 


5 Noisy digitalia in der historischen Analyse 


Wie sollten wir nun mit diesen Stördaten in unseren digitalen Quellen, seien es 
Flame Wars oder Hate Speech, Spam-Fluten oder nichtmenschliche Kommuni- 
kation, in der historischen Arbeit umgehen? Zwei grundsätzliche Möglichkeiten 
scheinen sich mir hierbei anzubieten: Entweder versuchen, sie einzubinden mit 
all den Weiterungen, die dies nach sich ziehen könnte oder den Lärm weitestge- 
hend auszufiltern, was aber Folgen für die Validität der Daten bzw. der Inhalte 
haben kann. 

Wie eingangs erwähnt, erscheint es wenig problematisch, wenn wir das ver- 
wendete Material selbst ansehen und den Noise direkt erkennen und einordnen 
können; nichts anderes beinhaltet die Arbeit mit nicht-digitalen schriftlichen 
Quellen. Arbeiten wir jedoch mit Hilfe des Computers und analysieren unsere 
digitalia in größerem Maßstab, können umfangreiche Vorarbeiten im Sinne ei- 
nes Data Cleaning und Preprocessing nötig werden. Bezogen auf die vorher aus- 
geführten Störkategorien kann sich dies unterschiedlich problematisch gestal- 
ten. 

In Bezug auf Spam-Nachrichten funktioniert eine Filterung verhältnismäßig 
gut. Die gewohnten Spam-Filter orientieren sich an bestimmten Schlüsselwör- 
tern, um entsprechende Nachrichten auszufiltern und lassen sich zum Teil im 
Nachhinein anwenden. Dies geht sowohl mit E-Mails als auch mit Usenet-Nach- 
richten, da beide Formate zum einen ursprünglich auf demselben RFC-Standard 
822 („Standard for the Format of ARPA Internet Text Messages“) beruhen und 


28 Vgl. Joseph Seering et al., „The Social Roles of Bots. Evaluating Impact of Bots on Discus- 
sions in Online Communities,“ Proceedings of the ACM on Human-Computer Interaction 2, Com- 
puter Supported Cooperative Work (CSCW) (2018): 1, doi: 10.1145/3274426. 
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zum anderen manche Mailprogramme zugleich als Newsreader fungieren und 
entsprechend die gleichen Filter-Plugins angewandt werden können. Trotzdem 
muss jeweils nachgehalten werden, ob die Filteroptionen nicht auch normale 
Nachrichten aussortieren. Bei aktuellen historischen Arbeiten zum Usenet wur- 
de das Spam-Problem adressiert: Avery Dame-Griff beschreibt bei seiner Unter- 
suchung von Transgender-Newsgroups das zunehmende Auftreten von Spam- 
Nachrichten, die nicht nur Werbebotschaften, sondern auch automatisierte 
Anti-Transgender-Postings transportierten.”” Aus diesem Grund entschied er 
sich, diese Nachrichten nicht auszufiltern, „as they formed an inextricable part 
of the Usenet experience. Nevertheless, this choice did consequently limit the 
applicability of more linguistically focused methodology, such as topic model- 
ling.“ In ihrer Doktorarbeit zur LGBTQ-Identität im frühen Internet beschäftigt 
sich Sarah McTavish ebenfalls mit entsprechenden Newsgroups und stellte in 
Hinblick auf die Gruppe alt.sex.motss fest: „[T]Jhe group quickly became consu- 
med with spam messages, both explicit and not.“?! Inwiefern diese Nachrichten 
Teil ihrer Analyse sind, wird jedoch leider offen gelassen. 

Wenn wir den Blick auf das Flaming wenden, gibt es bereits Ende der 
1990er Jahre, als die Sozialwissenschaften speziell das Usenet als Untersu- 
chungsgegenstand für sich entdecken, erste Versuche, Tools zu entwickeln, die 
Flames erkennen und ausfiltern können.” Grundsätzlich arbeiten diese Anwen- 
dungen wie moderne Hate-Speech-Detektoren, mit Machine-Learning-Metho- 
den. Das Programm erlernt also bestimmte Schlüsselbegriffe und Kommunikati- 
onsmuster und versucht damit, entsprechende Inhalte zu erkennen.” Abgese- 
hen davon, dass der Erfolg dieser Methoden wie immer von den Trainingsdaten 
abhängt, findet Flaming - das sich oft ironisch oder sarkastisch darstellt - 
manchmal so subtil statt, dass diese Tools an ihre Grenzen stoßen. 

Die technischen Möglichkeiten, Bots ex post zu identifizieren, sind ebenfalls 
begrenzt, da die entsprechenden Programme meist versuchen, den ursprüngli- 


29 Vgl. Avery Dame-Griff, „Herding the ‚Performing Elephants:‘ Using Computational Methods 
to Study Usenet,“ Internet Histories 11/10 (2019): 12, doi: 10.1080/24701475.2019.1652456. 

30 Ibidem. 

31 Sarah McTavish, „The Queer Eternal September: LGBTQ Identity on the Early Internet and 
Web“ (Dissertation University of Waterloo, Ontario, 2020), URI: http://hdl.handle.net/10012/ 
16336, 105. 

32 Melanie Martin, Annotating Flames in Usenet Newsgroups: A Corpus Study (NSF Minority 
Institution Infrastructure Grant Site Visit to NMSU CS Department, 2002). Zugriff am 
30.08.2021, https://www.cs.nmsu.edu/-mmartin/pubs/martin_poster.pdf. 

33 Vgl. Sasha Sax, Flame Wars: Automatic Insult Detection (Stanford University, 2016), De- 
partment of Computer Science Report, Stanford University, Zugriff am 30.08.2021, http:// 
cs224d.stanford.edu/reports/Sax.pdf. 
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chen Absender per IP-Adresse zurtickzuverfolgen, um einen Bot erkennen zu 
können. Dies ist bei archivierten digitalia jedoch nicht mehr ohne weiteres mög- 
lich. Auch imitieren moderne Bots das menschliche Kommunikationsverhalten 
oft so echt, dass es kaum mehr von dem echter Nutzer:innen zu unterscheiden 
ist.“ Das führt zu der fast schon paradoxen Situation, dass künstliche Intelli- 
genz - wenn wir fortgeschrittene Machine-Learning-Technik so nennen wollen - 
versucht zu erkennen, ob eine andere künstliche Intelligenz die Kommunikati- 
on von Menschen imitiert hat. 

Grundsätzlich würde ich die Frage nach Einbinden oder Ausfiltern von der 
jeweiligen Forschungsperspektive abhängig machen wollen. Wenn durch Di- 
stant Reading alle Aspekte eines digitalen Kommunikationsclusters erfasst wer- 
den sollen, verbietet sich eine Filterung fast von selbst. Auch können solch ne- 
gative Erscheinungen zu entscheidenden Hinweisen auf Bereiche werden, die 
Close Reading erfordern. Ebenfalls sollte nicht unterschätzt werden, dass Spam 
und noch mehr das Flaming ein natürlicher Teil der historischen Internetkom- 
munikation ist, der auch nonkonforme Akteur:innen - Rebell:innen, Brigant:in- 
nen, Anarchist:innen - repräsentiert. 

Geht es jedoch um klar eingegrenzte Inhalte, die vom Noise offensichtlich 
massiv gestört werden, ist eine starke Filterung sicherlich das Mittel der Wahl, 
nicht zuletzt um eine sinnvolle linguistische Analyse zu ermöglichen. Grund- 
sätzlich besteht jedoch bei allen Verfahren des Data Cleanings die Gefahr einer 
determinierenden Vorgehensweise. Die Parameter der Filter werden dann, über- 
spitzt gesagt, einfach so lange angepasst, bis die Daten zur vorgegebenen Fra- 
gestellung passen. Dadurch besteht, wie durch die unkritische Verwendung 
von Tools, deren genaue Funktionsweise nicht nachvollziehbar ist, letztlich die 
Gefahr, das vielbeschworene „Vetorecht“ der Quellen zu unterminieren, also 
falsche, beziehungsweise nicht mehr durch das Quellenmaterial gedeckte Deu- 
tungen zu provozieren. 

In diesem Zusammenhang soll noch einmal betont werden, dass die Kennt- 
nis davon, unter welchen Prämissen bestimmte digitalia archiviert worden sind, 
entscheidend bei der Einordnung der gespeicherten Daten ist. Bei der Webarchi- 
vierung wird beispielsweise nicht alles grundsätzlich gespeichert, sondern so- 
wohl aufgrund technischer Kapazitäten, als auch aus Relevanzgründen im Vor- 
feld die speicherwürdigen Webseiten ausgewählt, mit der Gefahr, bestimmte 
Randaspekte auszuklammern und nicht zu überliefern. In den letzten Jahren 
hat eine engagierte Diskussion über die ethischen Aspekte der Webarchivierung 


34 Vgl. Adrian Rauchfleisch und Jonas Kaiser, „The False Positive Problem of Automatic Bot 
Detection in Social Science Research,“ PLOS ONE 15/10 (2020), doi: 10.1371/journal. 
pone.0241045. 
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zudem dazu geführt, dass manche Inhalte ganz bewusst nicht archiviert oder 
massiv gefiltert werden, um beispielsweise Opfer rassistischer oder homopho- 
ber Attacken im Netz zu schützen.” Dies führt ganz allgemein zu dem Problem, 
dass hierbei viele rechtliche Fragen, namentlich bezüglich der Urheber- und 
Persönlichkeitsrechte, noch nicht ausreichend geklärt sind. Diese Probleme be- 
treffen zum einen den Archivierungsprozess, zum anderen aber auch massiv 
die Forschungsarbeit mit rechtlich heiklen Beständen. Zwar kann die Analyse 
und Bewertung des Materials eventuell in einem rechtlich sicheren Rahmen 
stattfinden, soll jedoch im Sinne eines guten Forschungsdatenmanagements 
die Datengrundlage nachverfügbar gemacht werden, könnte dies problematisch 
werden. Die Arbeit mit digitalia hält jedenfalls offensichtlich noch einige Un- 
wägbarkeiten bereit. 
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